Encuestas: ¿Quién va ganando las elecciones del 10N?
Así es la predicción de nuestro modelo estadístico a partir de encuestas y 15.000 simulaciones. Con escaños y mayorías
El gráfico muestra el promedio de sondeos de EL PAÍS actualizado el pasado domingo. Mantiene primero al PSOE (27,2% de votos), seguido de PP (21,1%), Vox (12,8%), Unidas Podemos (12,7%), Ciudadanos (9%) y Más País (3,8%).
Predicción de escaños. A partir de los sondeos nuestro modelo estima que el PSOE rondaría los 116 diputados en las próximas elecciones seguido del PP (94), Vox (42), Unidas Podemos (36) y Ciudadanos (19).
Las horquillas son amplias pero no caprichosas: representan la precisión de las encuestas en el pasado. Para hacer los cálculos usamos un modelo estadístico y simulamos las elecciones miles de veces. El modelo se alimenta del promedio de encuestas y tiene en cuenta su precisión histórica. Al final se puede consultar la metodología.
Quién alcanzará la mayoría. Para escoger al presidente y gobernar son necesarios 176 escaños. ¿Qué partidos tienen opciones de sumar suficientes diputados? Las encuestas no pueden responder esa pregunta, pero un modelo como este sí.
La derecha (PP, Vox y Ciudadanos) tiene un 9% de probabilidades de alcanzar la mayoría y la izquierda (PSOE, UP, MP) un 15%. Un acuerdo de la izquierda con PRC, CC y PNV aumenta sus opciones hasta el 31% (es decir, suman 176 escaños un tercio de las veces). En el 60% de las simulaciones ninguna de estas opciones es posible.
La tabla siguiente muestra otras posibles mayorías y sus probabilidades.
Las 15.000 simulaciones partido a partido. El siguiente gráfico muestra la distribución de escaños en cada simulación. Ahí puede verse la incertidumbre de las encuestas. El PSOE ronda los 116 escaños, pero su intervalo (al 90%) va de 89 a 140 diputados. Hay un 5% de probabilidades de que se salga por abajo y otro 5% de que lo haga por arriba. Estas horquillas reflejan el grado de precisión de las encuestas en el pasado. Al acercarse las elecciones los márgenes de error se reducirán ligeramente.
Aquí se muestra el resultado del resto de partidos. Sus resultados son más difíciles de precisar porque se publican pocas encuestas al nivel autonómico.
La lucha por cada puesto. La tabla representa la probabilidad que tiene cada partido de quedar en cada puesto. El PSOE será primero con una alta probabilidad aunque no definitiva (83%). Otras posiciones están aún menos decididas. Vox, por ejemplo, es tercero en seis de cada diez simulaciones, cuarto en tres y quinto en una de cada diez. La lucha por el tercer puesto está muy abierta.
Predicción final
Durante esta semana publicaremos una última predicción que incluirá las encuestas del lunes y una predicción de los escaños probables, posibles y en juego de cada provincia. ¿Quieres que te avisemos? Suscríbete a la newsletter de Kiko Llaneras y recíbela en tu correo.
Metodología. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en las elecciones de abril, en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en cuatro pasos: 1) agregar y promediar las encuestas, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 15.000 elecciones para repartir escaños y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha. Los detalles pueden consultarse en esta página web.
Paso 2. Proyectar el voto a cada provincia. Antes de calcular los escaños es necesario estimar el porcentaje de votos de cada partido en cada provincia. Lo habitual para hacer esto es usar sus resultados en anteriores elecciones. Es sencillo y funciona bien (si un partido crece, es lógico pensar que crecerá más donde ya era más fuerte). Pero la aparición de Más País obliga a hacer algunas modificaciones. El partido de Errejón solo se presenta en algunas provincias y eso añade dos dificultades: 1) decidir cómo distribuir sus votos y 2) penalizar al PSOE y UP en las provincias donde Más País concurre. Para lo primero hemos usado los datos de transferencias desde el resto de partidos (sabemos por encuestas que alrededor del 38% de los votantes de MP vienen del PSOE y el 42% de UP, así que es razonable asumir que al partido le irá mejor donde PSOE y Podemos son fuertes). El segundo problema es que, dado que MP existe solo en algunas partes, no podemos reducir (o aumentar) linealmente los votos de PSOE y UP en todas las provincias, sino que debemos penalizar sus números donde concurre Errejón. Lo hacemos restándoles en cada provincia restándoles una parte (38% y 42%) de los votos que tenga allí MP. Esta resta solo aplica parcialmente en la Comunidad Valenciana: MP solo resta a PSOE y UP por los votos que consiga sobre los que ya tenía Compromís.
Paso 3. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.
Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 1,9 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).
Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración".
Paso 4. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.
Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. A nivel nacional fallaron por pocos puntos incluso con Trump o con el Brexit, y desde entonces se han estado bastante precisos en muchas elecciones, como pasó en México, Brasil, Colombia, Francia, Países Bajos, País Vasco, Galicia o Cataluña. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.