A los futuros periodistas ya se les debería empezar a decir que aspiren a que una base de datos no les estropee un buen titular. De siempre se había dicho “que la verdad no te estropee una buena foto” o, más aún, “que la realidad no te estropee un buen titular”. Pero ya estamos en la era del periodismo de datos, con su capacidad para cuantificar la realidad y, además, visualizarla a través de sus potentes herramientas. Las bases de datos compiten, en lo de llamar la atención, con un buen titular. ¿Te ha llamado la atención el mío? Pues veamos quién es Kiko.
Kiko Llaneras, después de doctorarse en ingeniería, decidió probar a hacer lo que ya se llevaba haciendo tiempo atrás en USA. De hecho, Nate Silver habla de regresiones hasta en Twitter, casi siempre analizando la actualidad política. Sí, una regresión le cabe en 140 caracteres.
Nuestro Kiko trabaja como periodista de datos en El País. Como punto fuerte, lleva ya un tiempo con un modelo propio para tratar de predecir lo que ocurrirá en las elecciones. Lo he comentado con mucha gente y, en general, creen que se trata simplemente de agregar los resultados de muchas encuestas y apostar al valor promedio. Y lo que no saben es que esa debe de ser la parte más aburrida de su trabajo.
Lo cierto es que ha creado un laboratorio de simulación que, en realidad, le permite responder a más preguntas que a la tradicional ¿quién ganará las elecciones? . Por ejemplo, puede dar una probabilidad al evento «ganar las elecciones», pero también a los eventos más interesantes para los periódicos: pactos incluso al nivel de las circunscripciones.
Su modelo funciona, de manera sencilla, de esta forma: con los datos de encuestas, estudia la distribución de probabilidades de voto por partido. Utiliza encuestas de periódicos autonómicos, por ejemplo, y usa un modelo de extrapolar la intención de voto a cualquier circunscripción. Pero le añade conocimiento externo: cuánto se equivocan en general esas encuestas y esos modelos de extrapolación. Para ello, tiene un registro muy amplio del error mundial de los sondeos electorales atendiendo a su diseño, la configuración política del país y la fecha en que se hacen. Entonces, Kiko ya no tiene sólo una distribución para el voto de cada partido (proveniente de encuestas distintas) sino una distribución para el error de esas encuestas tratando de predecir el ganador. Además, introduce información del CIS. De ahí saca, por ejemplo, una matriz que estima la transición de votantes entre partidos. Ah, y una información relevante: el recuerdo del voto. Después de unas elecciones, el CIS pregunta a quién se recuerda votar. Comparando esas proporciones con los resultados electorales, se puede analizar la tendencia a mentir de los individuos, por ejemplo, en ciertos partidos.
Con todo ello, en un ordenador, genera un montón (10.000) días electorales. Esto es con lo que, el lector no iniciado, alucinará. Es como si ese lector se levantara 10.000 veces el mismo día de las elecciones e hiciera algo forzado por un conjunto de distribuciones estadísticas que saben mucho de él pero que, en realidad, dominan su voluntad. De esta forma, lo que hace Kiko es «mezclar» todas esas distribuciones que dan lugar, por lo tanto, a decisiones de voto de ese individuo que se levanta 10.000 veces. Al final, tiene una colección de 10.000 respuestas a diferentes preguntas. Puede, por ejemplo, contar cuántas veces van a pactar dos partidos y dividirla entre 10.000. ¿Qué consigue? Pues la probabilidad de que eso ocurra.
Aunque es cierto que la mente humana no está muy preparada para entender las probabilidades, aquí lo explica Kiko. La dificultad añadida, entonces, es hacer ver a su audiencia lo que implican esos resultados probabilísticos. Puesto que sus modelos no están preparados para dar titulares rotundos, sino titulares difusos, con porcentajes, tratando de hacer ver al lector que, aunque un 68% de probabilidades de que ocurra algo es un número alto, quiere decir que 1 de cada 3 veces ocurrirá lo contrario.
Ahora me desdigo de mi titular. No quiero ser Kiko Llaneras. Quiero ver cómo evoluciona, sufrir cuando sus modelos no predigan con precisión, o cuando los otros periodistas que lo interpreten lo hagan de manera sesgada. Quiero que, si tengo hijos en alguno de esos posibles 10.000 experimentos aleatorios, me digan, con probabilidad 1, que quieren ser Kiko Llaneras. Así sabré que tienen el futuro asegurado. Llegar a ser Messi, todos lo sabemos, será improbable.
Jorge Herrera de la Cruz
Es profesor del Departamento de Matemática Aplicada y Estadística
- Pirámide alimenticia: Definición y ejemplos - 13 de septiembre de 2024
- Cómo impulsar tu carrera con un convenio de prácticas - 6 de septiembre de 2024
- Por qué estudiar Marketing - 21 de agosto de 2024