Las estimaciones de voto a partir de encuesta fallaron el 26-J. Principalmente porque no pudieron responder a dos preguntas claves sobre el resultado: la ocurrencia del sorpasso de Unidos Podemos al PSOE y el aumento de voto del PP. Los gráficos 1 y 2 muestran algunos datos sobre estos fallos. Para realizar los gráficos he seleccionado la última encuesta que realizó cada empresa demoscópica durante la campaña, además de las encuestas a pie de urna.
El gráfico 1 trata sobre el sorpasso. Como se puede ver, ninguna de las encuestas realizadas antes o el mismo día de las elecciones estimó que el porcentaje de voto al PSOE estaba por encima del de Unidos-Podemos. Esto ocurrió principalmente por que el voto a Unidos Podemos fue sobreestimado, y en menor medida, el voto al PSOE fue subestimado.
El gráfico 2 muestra la diferencia entre el porcentaje de voto al PP estimado por las encuestas y el porcentaje de voto real que obtuvo el 26-J. De nuevo existe un sesgo porque todas las encuestas, sin excepción, estimaron que el PP tenía un porcentaje de voto menor del que finalmente tuvo el 26-J.
Las encuestas se basan en muestras, y se podría argumentar que teniendo en cuenta la incertidumbre derivada de preguntar solo a una pequeña fracción de la población, tanto el sorpasso como el ascenso del PP estaban contemplados. Sobre este problema en el contexto de las encuestas del 26-J han escrito María Ramos y Kiko Llaneras. Sin embargo, aunque la incertidumbre introducida por el error muestral puede hacer variar el resultado de las estimaciones de voto, en los gráficos de arriba se observa como las diferencias son sistemáticas. En todas las encuestas se observa la misma tendencia. Por lo tanto estas estimaciones de voto están sesgadas, y la pregunta es: ¿cuál es el origen de esos sesgos?
Cambio de última hora: Una de las primeras explicaciones que han aparecido tras el día de las elecciones es la posibilidad de que el Brexit haya provocado un movimiento de votantes de última hora desde las opciones emergentes (Unidos Podemos y Cs) hacia los partidos tradicionales (PP y PSOE). Esta opción es difícil de sostener porque los mismos sesgos que hemos visto en las encuesta durante la campaña (gráficos 1 y 2), también se observan en los sondeos realizados en los últimos días (GESOP) o el mismo día de las elecciones (GAD3 y Sigma Dos).
Participación electoral: Uno de los desafíos de las encuestas electorales es estimar la participación electoral, es decir, determinar quién va a ir a votar. Este es el paso previo a la realización de la estimación de voto. Si, por ejemplo, los potenciales votantes de un partido tienden a ir a votar en mayor medida que los votantes de otras formaciones, la encuesta necesita ser ajustada. Si este ajuste no se realiza la estimación de voto estará sesgada. Una de las hipótesis que se baraja con fuerza para explicar la incapacidad de las encuestas para detectar el no-sorpasso es que se ha sobreestimado la probabilidad de acudir a las urnas de los potenciales votantes de Unidos-Podemos.
Voto oculto: Otra hipótesis tiene que ver con la no-respuesta. Aquellos que rehúsan tomar parte en las encuestas, y aquellos que participando deciden no desvelar su intención de voto, pueden tener diferentes preferencias electorales. Si los que responden son más dados a votar a un partido que los que no responden, la estimación de voto estará sesgada. En nuestro caso se trataría de si los votantes de Unidos Podemos son más dados a responder encuestas en general, y a desvelar su voto, comparado con los votantes del Partido Popular. La “cocina” de las encuestas son los ajustes que se encargan principalmente de mitigar el problema de la no-respuesta. Los cambios continuos en el comportamiento electoral en los últimos dos años han hecho especialmente difícil detectar y ajustar el sesgo de no-respuesta en las encuestas pre-electorales.
Tipo de muestreo: La clave de una encuesta es que la muestra seleccionada sea representativa de la población, por eso el tipo de muestreo es importante. Las encuestas de opinión realizadas no seleccionan a los entrevistados aleatoriamente, lo hacen utilizando cuotas, por ejemplo de sexo y edad. En este tipo de muestreo, en primer lugar se eligen números de teléfonos o domicilios de manera aleatoria, posteriormente, una vez se ha contactado con el hogar, se elige a una persona que cumpla las características de las cuotas asignadas a los entrevistadores. Tras el fallo generalizado de las encuestas para estimar el resultado de las Elecciones Generales en Reino Unido en mayo de 2015, la comisión encargada de investigarlo concluyó que uno de los principales problemas es la falta de representatividad de las muestras por cuotas. Este podría ser otro aspecto a investigar en el caso español.
Modo de administración de la encuesta: Las encuestas pueden producir diferentes estimaciones según sea telefónica, personal o por internet. En el caso de España este es un punto menor dado que la inmensa mayoría de las encuestas utilizadas son telefónicas. Un aspecto a contemplar es cómo las empresas demoscópicas tienen en cuenta el hecho de que parte de la población tiene líneas fija y móvil, otra parte solo teléfono fijo y otra solo móvil.
La pregunta y el cuestionario: Diferentes preguntas sobre el mismo aspecto pueden llevar al mismo entrevistado a diferentes respuestas. Estos efectos han sido tenidos en cuenta durante mucho tiempo, sin embargo, sigue siendo una cuestión especialmente sensible a la hora de estimar la participación en las elecciones, paso previo a la estimación de voto.
Efecto “manada”: También conocido como “herding”, se refiere a un efecto psico-sociológico por el que las organizaciones o empresas que realizan encuestas tienden a confluir en sus resultados. No se trata de ninguna conspiración. Puede pasar en la medida que una casa de encuestas realice una estimación alejada de toda la información que existe en el momento y decida replantear la metodología de la estimación para ajustar su estimación a lo que el resto está publicando.
Estas son solo algunas de las hipótesis que se pueden plantear acerca del sesgo de las encuestas pre-electorales del 26-J. La estimación de resultados electorales a partir de encuestas es una tarea compleja, hay que asumir que a veces las encuestas fallan, especialmente en contextos políticos complejos. Sin embargo, ese no es el principal problema, lo grave es que aparte de plantear algunas ideas sobre las causas de los sesgos no se desarrolla una investigación sobre por qué ha sucedido este fallo generalizado. La clave sigue estando en la transparencia en la metodología. Las encuestas no dejan de ser elementos de utilidad pública con un papel destacado en el sistema político, y por lo tanto, deberían ser tratadas con la máxima transparencia siempre que vayan total o parcialmente dirigidas a los ciudadanos en general.
Gracias por recordar los varios problemas de las encuestas. Esos problemas no tienen solución fácil y uno puede esperar que las encuestas sigan teniendo sesgos (más allá de errores aleatorios). Además, esos problemas han sido discutidos muchas veces por lo que uno esperaría que a esta altura del siglo 21 no se diera tanta importancia a las encuestas. Pero, nos guste o no, las encuestas seguirán teniendo sesgos y más importante su presentación mediática seguirá siendo manipulada. Los politólogos poco pueden hacer para desalentar su mal uso mediático y me temo que han terminado haciendo lo mismo que muchos economistas hacen con las estadísticas, esto es, ignorando sus graves deficiencias (hoy la tecnología para la presentación de datos de todo tipo permite presentaciones muy atractivas lo que agrava el mal uso por los medios y por los académicos).
Hace unos años estaba en casa de unos parientes, cuando vino una chica a hacer una encuesta política, pues se acercaban las elecciones municipales. Había llamado a otras casas, pero nadie le abría, así que vino a probar suerte.
La chica preguntó quién era el dueño de la casa. Era el abuelo, así que a él le habría correspondido responder a la encuesta. Como se negó en redondo, uno de los nietos se ofreció a hacerla en su lugar. La entrevistadora le preguntó su edad, comprobó que aún no había cubierto el cupo de esa franja, y le hizo la encuesta.
No sé si el abuelo era del PP o del PSOE. El nieto era del PSOE, así que el PSOE salió como representante de ese domicilio, y posiblemente de todo el edificio, solo porque fue uno del PSOE el único que se animó a responder.
Pero eso sí: en los datos técnicos de la encuesta salió bien remarcadito «error +- 3», ese mantra místico con el que los sociólogos justifican todas sus cagadas.
El +/- 3% presupone que los datos son buenos. Por todas las razones comentadas, los datos no son buenos. Con más experiencia de 4 partidos «grandes» más los regionalistas, se puede cocinar, pero ya se introduce otro factor que afecta al +/- 3%.
El sistema de selección de encuestados tiene un condicionante claro: el coste. Con un sistema más caro, el error disminuye, pero ¿quién está dispuesto a asumir ese coste? Y aún así no se soluciona el problema del miedo a expresar determinadas intenciones de voto. Miro en mi entorno cercano, tanto geográfico como no, y poquísimos reconocen el voto al PP. Uno de cada tres personas que fueron a votar, votaron PP, en toda España, en mi ciudad, pero no lo reconocen. ¿Cómo evitarlo? Con mucha cocina. Nuevamente, el +/-3% peligra.
Pero, ¿realmente es un problema más allá del fracaso de las predicciones?
¿No existe conspiración? A lo mejor no, tal vez existan muchas conspiraciones, tantas como personas encargan encuestas.
Sería muy poco sensato pensar que no existe una intencionalidad en la publicación de una encuesta. Las encuestas influyen en el resultado, por muchos motivos. Si en mi provincia mi primera opción no tiene opciones de puntuar, puede inducirme al voto útil, si el resultado que ofrecen es de mayor inestabilidad, pueden inducirme a votar mi segunda opción menos arriesgada, si me hacen creer que una opción de izquierda (o de derecha) más radical i que genera mayor rechazo crecerá mucho puede inducirme al voto útil del sentido contrario.
¿Si las encuestas no influyen en el resultado, porque los diarios de distinto signo premian o castigan a determinadas opciones? ¿Si no influyen, porque se prohíbe su publicación la última semana?
Podemos era la opción que todos decían que subiría y mejoraría resultados… esto estimuló a ir a votar a sus votantes, o más bien influyó en su abstención? Y a la inversa, las malas previsiones de otros partidos, animaron o desanimaron a sus votantes a ir a votar?
La idea de que existe el “voto ganador” es absurda. Ahora nos dicen que en el Brexit un 7% de los votantes se arrepienten: votaron por la salida porque creían que ganaría el sí.
Insisto, no creo que exista una conspiración, pero sí que mostrar unos resultados sesgados en una encuesta puede tener efectos en el resultado.
Este gráfico de El País creo que refleja muy bien lo acontecido el pasado domingo y lo que las encuestas en ningún momento reflejaron.
http://elpais.com/elpais/2016/06/28/media/1467131682_616882.html