10 de agosto de 2009

Gráfico de escala variable

Mis lectores más conspicuos recordarán mis batallas contra las escalas truncadas. Lo he dicho tantas veces que no suelo volver a ello. Pero Defero (gracias) me ha llamado la atención (vía Barrapunto) sobre un extraño gráfico de escala variable publicado por Elpais.com, en el que no me había fijado. La página original es esta, y el gráfico ligeramente modificado lo tienen aquí (click para ampliar):



Las líneas rojas y verdes las he añadido yo para subrayar las desproporciones. Las líneas rojas, trazadas a ojo, van desde uno de los puntos hasta la altura a la que está un punto inferior separado por aproximadamente 300.000 parados (estrictamente hablando 288.000, 310.000 y 317.000). No hay proporción ninguna. Lo mismo se puede apreciar si nos fijamos en las propias líneas horizontales del gráfico. El valor 3.327,8 está casi exactamente sobre una de ellas. Dos líneas más abajo está el valor 2.818,0 (509.000 parados menos), pero dos líneas más arriba está el valor 3.644,8 (317.000 parados más). Es decir, que la distancia entre las líneas horizontales de la trama sería de unos 250.000 parados, en unas partes del gráfico, y de unos 150.000 en otras partes. De hecho, en efecto, el eje vertical no tiene ninguna rotulación, lo que permite ocultar la chapuza.

La línea verde es casi horizontal (quizá incluso ligeramente descendente), pero une dos puntos separados por más de 60.000 parados, lo que debería ser, incluso en esa parte alta del gráfico, una distancia vertical de más de un tercio de la distancia entre dos líneas horizontales. Un choteo, vamos, que es además difícil de imaginar que se haya producido de manera puramente accidental.

El efecto óptico resultante es que desde el punto máximo (abril) hasta julio se habría producido una reducción equivalente a más de un quinto del aumento del paro desde agosto pasado (entre agosto y abril la línea asciende menos de cinco tramos, marcados por las líneas horizontales, y desde abril a julio desciende un tramo entero). Si atendemos a los números, en cambio, el descenso desde abril es de 100.000 personas, frente a un aumento desde agosto a abril de más de 1.100.000 personas. Es decir, un descenso de menos de la décima parte. ¿Qué curioso, no?

Como ilustración rápida, esto es lo que me sale al hacer el gráfico con Excel, truncando el eje vertical, contra mis principios:


El descenso desde abril queda en su justa perspectiva, como debería ser. Eso sí, el eje truncado sugiere que el paro se ha multiplicado por seis o siete. Sigo prefiriendo el eje sin truncar:



Comentarios hasta el 01-01-10

"Un choteo, vamos, que es además difícil de imaginar que se haya producido de manera puramente accidental."

Los gráficos de las infografías se hacen a mano. Pero claro, siempre es más divertido elucubrar conspiraciones.

A mi me queda una sensación similar viendo el gráfico erróneo y el corregido (pero yo no tengo visión biónica). Hay que mirar a fondo el gráfico para ver el error. La sensación cambia mucho, eso sí, con el gráfico sin truncar. De todos modos es el chocolate del loro discutir sobre ello, porque las cifras absolutas valen de poco... lo que habría que dibujar es la tasa de paro, como sabe cualquiera que sepa algo de economía.

Que se hagan a mano no quiere decir que sea disculpable prescindir de las proporciones. Precisamente el representar datos mediante gráficos en vez de dar simples datos numéricos tiene el objetivo de que el lector se haga una idea de la relevancia de los datos, y para eso la proporción es crucial.

Sobre lo de "elucubrar conspiraciones", no veo que existan tales en el texto. Pero yo sí voy a elucubrar: no es casualidad que la MANIPULACIÓN de la gráfica sea para mostrar un dato más positivo de lo que es, teniendo en cuenta que se trata de EL PAÍS y gobierna el PSOE. De la misma manera, no me parecería casualidad que EL MUNDO realizara una manipulación en sentido contrario, haciendo aparecer un dato negativo como peor de lo que es.

Si te quedas igual viendo el gráfico erróneo y el corregido, es porque se te han debido de empañar las gafas, porque la diferencia entre los gráficos es brutal. El primero parece representar un brusco descenso, brusquedad que se queda en poca cosa en el segundo gráfico, y en prácticamente nada en el tercero. ¿Por qué se ha elegido el primero, y no alguno de los otros dos? Casualidad. Segurísimo que sí.

Hablar de cifras absolutas de desempleo es absurdo, no te lo niego, pero es que no nos hemos reunido aquí a hablar del paro, sino de la manipulación informativa, de la MALA PRENSA. Y en este caso la manipulación informativa ha sido acerca de la cifra absoluta de desempleo.

Este comentario demuestra lo fácil que es opinar y lo difícil que es informar.

Desde luego son unos sinvergüenzas. Llevo viendo el blog desde hace cierto tiempo y aprovecho la primera vez que comento para felicitarte por el exelente trabajo que estás realizando.

¡Saludos!

He mirado el gráfico con un poco de calma (los he comparado en un Excel) y el efecto óptico es que el paro subió a principios de año más bestialmente de lo que subió en realidad, y ha bajado también más bestialmente de lo real. Es decir, que subió mucho con el Gobierno ZP pero también está bajando muy rápido. Deducir de eso que se trata de favorecer al Gobierno me parece mucho deducir. Sí que se puede sacar la conclusión de costumbre: que los periódicos tienden a exagerar las cosas, incluso en algo tan medible como esto.

No hay comentarios:

Publicar un comentario

Gracias por participar. Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti, y tus comentarios no se confundan con los de otras personas.
Los comentarios de las entradas menos recientes son revisados por mí y no se publican inmediatamente.