7 de octubre de 2016

¿Tú también, Nate Silver?

Repasando el archivo de Malaprensa he descubierto que no he hablado casi nunca por aquí de Nate Silver y su página web Fivethirtyeight.com. Es extraño porque es una página que en sus diferentes encarnaciones (independiente, en el New York Times, ahora en ESPN) he seguido con pasión en cada cita electoral norteamericana, desde 2008, y que puede decirse que es la inspiradora de muchas otras excelentes páginas o secciones de periodismo de datos (no sólo electoral, también económico o deportivo) que han florecido en los últimos años en Estados Unidos.

Silver no es periodista, sino que tiene formación en economía y estadística, y después de ganar dinero jugando al poker y haciendo estadísticas de baseball se pasó a las predicciones políticas, en la campaña de 2008. Inicialmente escribía con pseudónimo en el blog pro-demócrata dailykos.com, estimando quién iba a ganar las primarias, y en vista de su éxito acabó creando su propia página, teniendo un éxito enorme, y luego fichando por The New York Times, al que llevó gigantescas cantidades de visitas durante la campaña de 2012. Después se trasladó a ESPN, donde su página incluye noticias, con enfoque cuantitativo siempre, sobre cinco secciones distintas (política, deportes, ciencia y salud, economía y cultura), aunque sospecho que son las dos primeras las que realmente interesan a la audiencia.

Precisamente en 2012 publicó un libro fantástico, La señal y el ruido, sobre por qué algunas predicciones aciertan y otras no, los avances en algunos campos de predicción científica (meteorología), las dificultades en otros (sismología), nuestros problemas para entender bien las predicciones y actuar en consecuencia... Es muy recomendable.

Pero, volviendo a su página web, todo su afán es darle vueltas a los números, cuantificar, estimar probabilidades... sobre todo tipo de cosas, algunas muy inusuales. Por ejemplo, esta semana escriben sobre cómo son los "típicos" ganadores del novel Nobel de química, física, de la paz... Una parte importante de su trabajo se vuelva vuelca en presentaciones visuales de los datos, impactantes, y a veces muy originales. Por ejemplo, esta "culebra" para representar cómo van las encuestas en los diferentes estados para las presidenciales, ha sido muy celebrada:



Es una manera muy ingeniosa de representar de un vistazo cómo se ordenan los estados según las encuestas, de menos a más apoyo a cada uno de los candidatos, quién va ganando (ahora mismo Clinton), cuánto margen de confianza tiene (cuántos estados le "sobran")...

En fin, todo esto es una introducción, que creía justificada para que entendieran ustedes mi decepción cuando en una página que tanto consulto y que tanto admiro me encuentro, en un artículo sobre la enorme ventaja de Clinton sobre Trump respecto al número de oficinas de campaña en los estados en disputa, aunque sin llegar al despliegue de Obama en 2012, con varios mapas como este:




Sí, amigos, sí, es dramático, pero Fivethirtyeight ha caído en el grosero error de representar el número de oficinas a través de círculos cuyas áreas no son proporcionales a las cifras que tratan de representar. Lo que son proporcionales son los radios de los círculos. Pero si un círculo tiene un radio que es el doble que otro, su área no es dos veces más, sino cuatro veces más (el área del círculo se calcula con la fórmula A= π*r2). Por eso, al dibujar el círculo que representa 50 oficinas con un radio que es el doble del gráfico para 25 oficinas, su área es cuatro veces mayor. Y el que representa 100 es cuatro veces mayor que el de 50, y ¡16 veces mayor que el de 25! Un disparate por el que he criticado muchas veces a medios españoles. ¡Qué decepción, Nate! ¿Cómo has permitido que hagan algo así en tu página?

[Actualización: corregido el título, que tenía errores de acentuación y puntuación (¡Madre mía!). También he añadido algunos enlaces que había olvidado incluir en la primera versión. Actualización 2: buff, había puesto novel en lugar de Nobel. Corregido. Actualización 3: otra errata (vuelva) corregida. No era mi día, claramente.]

5 comentarios:

  1. Hola, Josu, un matiz:

    Yo tampoco recomiendo cambiar la escala de los círculos en proporción a sus radios, sino a sus áreas. Sin embargo, algunos manuales de cartografía sugieren exagerar las diferencias entre los círculos para enfatizar las diferencias de magnitud. Hacen esto por algo que sabemos bien: Respetar el tamaño relativo de las áreas hace que los círculos en muchos mapa de símbolos proporcionales acaben siendo muy parecidos, sobre todo en aquellos casos en los que las diferencias entre los números representados no es enorme. Dicho esto, no he visto nunca un autor que diga que usar el radio sea correcto.

    ResponderEliminar
    Respuestas
    1. Gracias por el comentario, Alberto. Tú eres el experto, pero realmente, si los círculos proporcionales no se perciben bien, ¿por qué usar círculos?

      Eliminar
    2. Bueno,hasta el mejor escribano echa un borrón, que se dice. Así que habrá que perdonar a Nate jejej

      Eliminar
  2. Parece que fue un error de Nate Silver, porque por lo que veo ya está corregido y ahora el área de los círculos es proporcional a las frecuencias.

    ResponderEliminar
    Respuestas
    1. Bueno, el autor no es Silver, sino uno de los colaboradores.
      Y en efecto, explican que lo han corregido, al final del texto:
      UPDATE (Oct. 7, 11:20 a.m.): To better show the relative size of the candidates’ field operations in each state, the maps in this article have been updated so that the area of each circle, rather than the circle’s diameter, is proportional to the number of field offices.

      Eliminar

Gracias por participar. Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti, y tus comentarios no se confundan con los de otras personas.
Los comentarios de las entradas menos recientes son revisados por mí y no se publican inmediatamente.