sábado, 28 de septiembre de 2019

La precisión, el yerro y el cordobesismo.




Existen, al menos, dos aspectos importantes que hacen a la calidad de una medición: la precisión y la exactitud. La precisión es qué tan disperso puede ser el resultado de una medición cuando se mide repetidas veces la misma cantidad. En el caso de las encuestas es el tamaño de las barras de error, el así llamado “error muestral”, que sería una consecuencia del más puro azar y que sólo depende del tamaño de la muestra y, en menor medida, del tamaño de la población que se estudia. La exactitud, en cambio, es qué tan centrada es la medición con respecto al valor “verdadero”, por lo que sólo se puede dimensionar cuando se tiene conocimiento de este “verdadero” valor. Es la distancia entre el valor que parece más probable luego de repetidas mediciones y el verdadero valor, es el sesgo propio del método de medición, el desvío de la mira. En los estudios de opinión pública la exactitud es el santo grial, lo que los encuestadores y analistas tratamos de mejorar continuamente, sin nunca estar del todo seguros de haber llegado a la exactitud deseada. Justamente, exactitud no es precisión, cada metodología tiene su sesgo y por mucho que se agrande la muestra la mira va a estar igual de desviada. Los consultores lo saben, por eso no venden encuestas IVR de 10000 casos (la precisión sería del 1%, pero los sesgos están presentes de igual forma que en una encuesta de 600 casos).

La exactitud, o falta de ella, que tuvieron las encuestas de opinión a nivel nacional anteriores a las PASO en relación al resultado electoral demostró que, a pesar de los avances tecnológicos de los últimos 20 años, todavía no hay un método, de relativa fácil implementación y costos razonables, menos sesgado que las encuestas presenciales hechas a partir de un buen diseño muestral. Por buen diseño nos referimos a uno que tenga en cuenta una pluralidad de variables que resulten significativas en la caracterización de las identidades políticas y que al mismo tiempo sean bien conocidas y estén actualizadas. La selección de estas variables es altamente no trivial, y en esto reside buena parte del arte de diseñar una buena muestra.

En este sentido hay que destacar que las encuestas presenciales son superadoras a las telefónicas porque garantizan las respuestas de un espectro más amplio de personas, llegando mejor a los extremos sociales y económicos. Mientras que las encuestas CATI (Computer-Assisted Telephones Interviewing)  e IVR (Interactive Voice Response) no pueden hacerlo por razones ya conocidas: altas tasas de no respuestas (entre el 3% y 7% de respuestas), lo cual las convierte en métodos de baja confiabilidad en escenarios dinámicos, cercanos a elecciones generales y sobre todo polarizados.

De todas maneras, el hecho de que las encuestas presenciales sean más exactas que cualquier encuesta telefónica no es ninguna novedad, la abundancia relativa de encuestas CATI o IVR se explica simplemente por una cuestión de costos: es claramente más barato contactar gente telefónicamente que hacerlo de persona a persona. La novedad en esta oportunidad estuvo en otra cuestión: la inexactitud aún más marcada que tuvieron los métodos “on-line”, tanto las encuestas como las proyecciones basadas en data mining (esto último es materia de otro artículo).
Esto no quiere decir que las encuestas telefónicas o las on-line no sirvan. Una mira desviada puede ser casi igual de útil que una que no lo esté siempre que se conozca con precisión su desvío. Si se conoce, para una dada muestra, en qué medida ciertos sectores están sobrerrepresentados o subrepresentados se puede compensar el sesgo ponderando la muestra: esto es, asignando un peso a cada entrevistado, según las variables de diseño muestral, que compense esta sub o sobrerrepresentación, como si cada entrevistado valiera por más de una persona o por menos de una persona en función de qué sectores representa. Se pretende así centrar la mira, pero el precio a pagar es justamente la precisión, la muestra ponderada funciona como una muestra más chica que la sin ponderar. Pero el resultado es más confiable, y ante repetidas mediciones los valores promedios seguramente se acercarán bastante a los reales. La ponderación depende críticamente de la selección de aquellas variables que hacen al diseño de la muestra: las que consideramos importantes para subdividir (acariciar) significativamente al electorado. Es, por lo tanto, también un arte que cada analista practica no siempre con los mismos criterios. Fue tanta la distancia que hubo entre algunas encuestas y el resultado de las PASO que nos es lícito sospechar que algunos encuestadores ni siquiera se plantearon compensar los sesgos antes de publicar sus resultados.

El yerro del “independiente”.

Justamente, no todos nuestros colegas piensan que el problema sea puramente metodológico, algunos prefieren adjudicar la falta de exactitud a una supuesta volatilidad de la opinión pública. Existe una figura muy común y vagamente definida en el análisis político: el así llamado “votante independiente”, el chivo expiatorio de todos los yerros metodológicos. Este supuesto votante sería abundante (según cómo se lo defina serían entre el 20% y el 50% del electorado) y sin embargo sería difícil llegar a él o ella: no le gusta hablar de política y decide su voto en los últimos días e incluso directamente en el cuarto oscuro. La divergencia entre encuestas parece sugerir que aproximadamente el 30% del electorado evita sistemáticamente dar su opinión en encuestas, o si la da dice lo primero que se le ocurre y termina votando de manera totalmente independiente a lo que dijo en su momento. Sin desconocer que parte del electorado efectivamente puede comportarse así, de nuestra experiencia nos resulta mucho más plausible suponer que más erráticas son nuestras herramientas que la opinión pública.    
De todas maneras, en defensa de los trapos, debemos reconocer que las encuestas distritales mostraron tener una mayor exactitud, siendo que los comportamientos suelen ser más variables en poblaciones más pequeñas. Quizás en las provincias haya una mejor predisposición a contestar encuestas, además de que se requiere de menos presupuesto para mediciones presenciales.

Hablemos de Córdoba.

En el caso de Córdoba, la ventaja de la fórmula Macri-Pichetto por sobre Fernández-Fernández estuvo bastante bien medida por varios de nuestros colegas, se hablaba de entre 15 y 22 puntos de distancia, terminó siendo 18.3. Es particularmente interesante lo que pueda suceder en Córdoba el 27 de octubre, porque la clara diferencia de Macri hace que el microclima parezca tendiente a profundizar esa ventaja, pero al mismo tiempo la ola ganadora a nivel nacional va a tener cierta influencia por sí misma. Ambos efectos contradictorios entre sí se van a dar independientemente de las acciones de campaña, por lo que una radiografía precisa de aquellos votantes en esta provincia que sostienen que no pertenecen a una extracción politizada, que se sienten por fuera de los clivajes K - anti K o peronistas-antiperonistas, va a ser fundamental para dirigir estas acciones (esto es lo que nosotros llamamos “votante híbridos”: aquellos que se consideran por fuera de estos clivajes, y no necesariamente lo están). Por supuesto, esto va a ser de particular interés para las listas de diputados nacionales, donde unos pocos miles de votos de diferencia puede significar el acceso o no a una banca.

En términos puramente numéricos, Macri ganó en Córdoba casi como Fernández ganó en nación. En Córdoba: MM 50.1%, AF 31.8% mientras que en nación el resultado fue AF 49.5% y MM 32.9%. La victoria de MM en Córdoba es tan contundente como la de AF a nivel nacional. Marcan diferencias aparentemente irremontables y hablan de una clara preferencia del votante independiente o híbrido, según nuestra acepción. Este tipo de votante apoyó mayoritariamente a AF a nivel nacional (especialmente en Gran Buenos Aires, NOA, NEA y Patagonia), pero en Córdoba y en CABA sigue eligiendo a Cambiemos. Siendo CABA la cuna y bastión del macrismo, lo de Córdoba se configura como excepción en el plano nacional.

En Córdoba el corte de boleta tanto en la lista de Juntos por el Cambio como en la lista del Frente de Todos (en todos los casos a favor del tramo presidencial) fue casi idéntico en número: unos 7 puntos para cada lista (cerca de 160000 votos en cada caso), mientras que en el caso de la lista de Consenso Federal el corte fue de 3 puntos (unos 60000 votos). Puede que no sea muy sorprendente que la suma de estos números aproximados (7+7+3) de justamente los 17 puntos que sacó la lista corta de Hacemos por Córdoba, pero este hecho casi nos confirma que los votantes de la lista corta votaron casi en la misma medida tanto a Macri como a Fernández (a diferencia de lo que cierto sector del oficialismo provincial quiere instalar), y nos sugiere que la composición de los votos para presidente entre los votantes de la lista corta es aproximadamente (40%,40%,20%) para Macri, Fernández y Lavagna respectivamente. Nos confirma también de que no existen prácticamente los votantes de “sólo lista corta”, y es por eso que para sostener el corte quirúrgico de boletas hace falta, además de precisión (o exactitud en el mejor de los casos), cierta “neutralidad” en el discurso político a la hora de insinuar qué es lo que prefieren los cordobeses en términos nacionales. Si bien podríamos discutir, largo y tendido sobre cuáles son los componentes y condicionamientos políticos que hacen a dicha “neutralidad” por parte del principal referente de HpC, el gobernador Juan Schiaretti, lo cierto es que apalancar en la identidad territorial “cordobesa” ha sido la estrategia predilecta del oficialismo provincial, y a las pruebas hay que remitirse para demostrar su visible y sostenido éxito como tal. Sin embargo, no todo está dicho en la Córdoba de los cordobeses. Existen algunos movimientos que dan cuenta de que su matriz ideológica es permeable al clima nacional, lo cual puede inducir cambios en el comportamiento electoral. Cabe destacar que en este distrito a Alberto Fernández, en estas PASO, le fue considerablemente mejor que a Scioli en las generales del 2015: el frente contenedor al kirchnerismo subió de 19 a 32 puntos, mientras que Cambiemos bajó su performance de 53 a 50 puntos. Massa en las generales del 2015 había obtenido 20 puntos, mientras que Lavagna en esta oportunidad tuvo sólo 8 puntos: aparentemente la mayoría de los votos de Massa ahora fueron con Alberto y no tanto con Lavagna. Por lo cual la pregunta sobre cómo votarán los cordobeses en las generales de octubre, si seguirá siendo Córdoba la excepción nacional o si se alineará a un comportamiento más propio del total país, son preguntas que siguen sin responderse en tanto y en cuando no haya disponibles, para el análisis, mediciones rigurosas (presenciales) en el territorio provincial.