elecciones

Elecciones legislativas en Colombia: tres alternativas de predicción

11 Mar, 2018 - - @jorgegalindo

El domingo 11 de marzo se celebran las elecciones legislativas colombianas. Son unos comicios complejos, en los que más de una decena de plataformas intentarán obtener o aumentar su representación en la Cámara y en el Senado (si alguien quiere leer sobre la competición política colombiana de hoy antes de seguir adelante, le invito a zambullirse en esta serie de textos sobre los partidos). Además, se celebran dos consultas interpartidistas, o elecciones primarias abiertas, para candidatos a la presidencia.

Aunque los intentos de predecir el resultado en las elecciones presidenciales (que tendrán lugar en un par de meses) abundan, no tanto para las legislativas. No hay, de hecho, muchos datos para realizar dichas predicciones. Lo cual las convierte en un estudio de caso particularmente interesante, por retador.

Centrémonos en la elección senatorial. Desde este año el Senado de la República contará con 108 escaños. De ellos, 100 se someten a competición abierta este domingo (2 corresponden a circunscripciones especiales, 5 están reservados al partido de las FARC en virtud de los acuerdos de paz recientemente firmados, y 1 se reserva al perdedor de la segunda vuelta de las presidenciales de junio). Lo hacen en circunscripción única nacional. Los partidos eligen si compiten con lista cerrada (la minoría) o no (la inmensa mayoría). Y los escaños se reparten con el sistema d’Hondt, aplicando un umbral mínimo del 3% del voto nacional.

Este artículo es un pequeño ejercicio basado en tres métodos de predicción (no independientes entre sí, como se explicará: más bien anidados) aplicados a estas elecciones. Mi objetivo no es tanto acertar como explorar cada uno de las alternativas, facilitando la comprobación a posteriori de cómo han funcionado.

Comencemos pues con la más básica: los sondeos.

1. Encuestas de intención de voto

Las encuestas siguen siendo la herramienta de predicción electoral más habitual. Sin embargo, y probablemente por motivos de coste-beneficio metodológico, en Colombia no hay muchas casas que hagan campo para las legislativas. De hecho, casi ninguna lo hace de manera expresa y pública (en privado todo es distinto, claro, pero a esas no tenemos acceso). Pero varias incluyen la pregunta de “a quién piensa votar para las legislativas” en sus encuestas para las presidenciales. Hace cinco días, el politólogo de la Universidad del Rosario Daniel Felipe López realizó el interesante ejercicio de coger los resultados de tres de esos sondeos, los más recientes, y elaborar una estimación de escaños para los partidos. La colgó en Twitter. Donde también explicó que había tomado como referencia una participación del 50% (unos 18.000.000 de votos dado el censo de votantes actual). Las cifras resultantes son muy dispares, lo cual llama a la cautela. Como también lo hace el enorme porcentaje de voto en blanco/por otros que estiman las tres casas de encuestas: alrededor del 35%.

En el siguiente cuadro incluyo las estimaciones de López junto a una variación, calculada por mí gracias a este script de R, en las que atribuyo una participación más baja (40%) para observar variaciones.

Los distintos supuestos de participación sólo ponen a danzar uno o dos escaños aquí y allá (serían más si asumiésemos cambios más grandes, pero tampoco tenemos razones para ellos: en 2010 y 2014 la abstención estuvo en niveles muy similares, alrededor del 55%), pero los cambios entre encuestadoras son muy grandes. Las últimas dos columnas ofrecen los puntos mínimos y máximos de los seis pronósticos, y las horquillas son en algunos casos tan grandes que a duras penas resultan operativas. Sin embargo, los números sí son informativos. Dejan claro, por ejemplo, que el Centro Democrático (CD) es la formación más fuerte, y que Liberales, Conservadores, Cambio Radical y el Partido de la U forman un segundo grupo que se solapa con el tercero: el que forman la Alianza Verde y el Polo. Después ya vienen los que luchan por conseguir representación: los Decentes de Petro, MIRA, y Opción Ciudadana. Claro, que eso tampoco es muchísima información.

2. Modelo mixto: Cifras & Conceptos

Ante estos problemas, la casa Cifras & Conceptos ha tomado una aproximación aparentemente más sólida (y, particularmente, mi preferida). Su modelo de pronóstico para el Senado añade a los datos de encuesta otra mucha información: datos históricos, de la Cámara, evaluación de ‘herederos’ políticos, opiniones de expertos, encuestas cerradas, e información de redes. Con todo ello llegan a una lista de 70 senadores con una muy alta probabilidad de lograr su escaño, y otra de 50 senadores probables mas no seguros que se disputarán los 30 lugares restantes. En última instancia ofrecen una estimación para cada partido con horquillas generosas pero más razonables que las mostradas en el punto anterior: Centro Democrático destaca, entre 19 y 24. Después vienen los Conservadores (15-18), Cambio Radical (14-18), Partido de la U (14-17), y los Liberales (12-16). A continuación están Alianza Verde (5-8) y el Polo Democrático (3-5). A la cola, Opción Ciudadana (0-4), MIRA (0-4) y la Lista de la Decencia (0-4). De nuevo emergen los grupos de partidos, con la misma estructura que la que dan las encuestas desnudas, pero ahora algunas formaciones cuentan con más potencia. Es el caso sobre todo de La U, CR y el Partido Conservador. Probablemente se deba a que el método de C&C es capaz de capturar el voto clientelista o de maquinaria mejor que los puros sondeos. Y por eso también la Alianza Verde y el Polo tienen unos niveles más modestos: porque es posible que las encuestas sobre-estimen el voto de opinión que favorece a estas formaciones.

El problema de esta aproximación es que es menos reproducible y testable. Pero quizás sea un precio que merezca la pena pagar.

3. Wisdom of crowds: la predicción de Twitter

Anoche, Rafael Noguera lanzó en Twitter una sugerencia habitual en época de elecciones: que cada uno haga su apuesta del Senado. Yo me tomé la libertad de recopilar cada una, descartando las que no cuadraban (suma de escaños estrafalaria). El resultado es este Google Docs, y la siguiente tabla resumen.

En esta predicción participan personas de todo perfil: personas de la academia, periodistas, ciudadanos anónimos. Resulta en un ejercicio de ‘sabiduría de las masas’ de los que tanto han dado que hablar últimamente. Las apuestas de los expertos no tienen más peso, ni menos, sino el mismo. Hay un debate rico y animado sobre si los expertos son sustanciamente mejores haciendo predicciones sobre su tema  (véase este artículo de NPR, por ejemplo). Aquí he decidido agregarlas todas por igual. Esto conlleva algunos problemas, como que Opción Ciudadana aparezca con un escaño. Eso parece imposible, como me han hecho notar Juan Esteban Lewin y Laura Villa. Si alguien quiere hacer la prueba, puede intentar repartir, digamos, dieciséis millones de votos asignando un 96.9% a un hipotético partido A y un 3.1% a un partido B empleando d’Hondt. El resultado es que A se lleva 97 senadores y B, 3. Si uno varía a mil votos, o a diez millones, la cosa queda igual. Así que OC no puede quedar con un escaño: la predicción para ellos sería errónea de base.

Sin embargo, la ventaja de no excluir a los no expertos es la capacidad de incluir y, si los hay, detectar lo que Philip Tetlock llama super-predictores o superforecasters. Personas con poderes predictivos que van más allá del expertise. Yo mismo tengo mis dudas respecto a esta figura y a los trabajos de Tetlock, y desde luego que acertar una sola vez no indica ni muchísimo menos que uno entre en este grupo. Pero al menos es un primer intento.

Otra cuestión fundamental es si este tipo de ejercicios reduce o incrementa el sesgo de la predicción. Si los participantes cuentan con información distinta entre sí (o con información completa y compartida, pero sesgos individuales distintos), la agregación ayuda. Pero si la información es incompleta y compartida, o si hay algún tipo de interpretación conjunta de dicha información, entonces el ruido domina la agregación.

En ese sentido, es interesante comprobar en qué partidos existe más dispersión de apuestas. Esto es algo que podemos medir, por ejemplo, con la desviación estándar y la varianza de cada formación.

La suerte del CD, de la Lista de la Decencia y de Cambio Radical genera mucho menos consenso que el hecho de que las FARC no vaya a conseguir curules extra (además de los 5 que ya tiene asegurados). Sobre La U, Conservadores y Liberales también hay dudas considerables. Menos para MIRA, AV y PDA. Aunque nótese que las medidas de dispersión son mayores para los partidos más grandes, algo en cierta medida inevitable y casi mecánico.

A pesar de esta varianza, las predicciones de Twitter no difieren enormemente de las encuestas, ni del modelo de C&C. No al menos en el orden de partidos, a grandes rasgos. Es normal: al fin y al cabo, es muy probable que estas sean las principales fuentes de información para los apostadores. Salvo para algunos, los llamados expertos, que tendrán acceso a información histórica, análisis territorial, estructural, e incluso datos provenientes de los propios partidos y candidatos.

Este es el principal problema para los pronósticos sobre el Senado en Colombia: la falta de puntos de referencia. Por eso, y ya para terminar, he seleccionado diez personas que hicieron pública su apuesta y cumplen con las siguientes características: (1) no son anónimos; (2) son expertos o insiders políticos gracias a su trabajo o su activismo; (3) no tienen errores formales — sus apuestas suman cien y no dan menos de 3 senadores a ningún partido.

Como se ve, la dispersión no baja tanto como cabría esperar. Los expertos no parecen estar mucho más seguros que el resto. Eso sí: suben el CD, conservadores y la U, baja CR, y desaparece (porque así se fuerza) el escaño erróneo de OC. Es decir: algunos cambios, pero nada radical. Parece que, efectivamente, todos jugamos con información similar.

* * *

Aquí termina esta fase del ejercicio, sin conclusión por ahora. Dicha conclusión llegará una vez conozcamos los resultados finales, mañana por la noche. Entonces podremos valorar toda esta ensalada de pronósticos.