23 de mayo de 2016

La alta velocidad está infrautilizada, pero no como lo cuenta El País

Me sorprendió ayer este titular de una noticia de El País:

Una de cada cuatro estaciones de AVE tiene menos de 100 pasajeros al día

Me chocaba y me temía que la noticia contendría errores. Y los tiene. Unos cuantos. El primero y más obvio: por las estaciones de alta velocidad pasan y paran trenes con varias denominaciones comerciales y tipos de servicios. Todos ellos son de alta velocidad. Los más rápidos, que hacen recorridos largos, y que tienen más servicios a bordo, varias clases, etc... se llaman comercialmente "AVE". Otras denominaciones comerciales, como los Avant, Alvia, etc...,  se refieren a trenes que también son de alta velocidad (aunque velocidades punta algo más bajas) y que son por otros motivos "inferiores" a los AVE (menos servicios a bordo, una sola clase...).

La estadística que maneja El País se refiere solamente a los trenes AVE, no a otros trenes de Alta Velocidad. Y eso desfigura los datos de algunas estaciones, y como las de Valladolid, Segovia, Toledo, Ciudad Real o Puertollano (tal vez me deja alguna otra) donde la inmensa mayoría de los pasajeros son "viajeros de alta velocidad" pero no viajeros de AVE. Este hecho es sólo parcialmente reconocido por el texto de la noticia (en el párrafo 11) y sin dejar claro que los usuarios de esas estaciones en trenes no-AVE (pero sí alta velocidad) son muchos cientos de miles más que los que aparecen en su texto.

Veamos el caso de Toledo, que me es bien conocido. Según El País, esta es la gráfica de los usuarios de AVE en esa ciudad (entre 2010 y 2014):


Gráfico muestra 2.200 usuarios en 2010 y 2011; ninguno en 2012 y 2013; y 222.500 en 2014

Tan rarísima trayectoria se explica en la noticia así:
El AVE que paraba en Toledo se suprimió en 2012 y 2013 –en esos años solo circulaba Avant-- y se recuperó en 2014 para el año del Greco. Actualmente tampoco hay AVE. El usuario apenas nota la diferencia de tiempo en el trayecto; sí en el precio del billete: el AVE siempre es más caro.
Se entiende bastante mal, pero yo se lo explico: entre Madrid y Toledo hay, desde la inauguración de la línea de alta velocidad, unos trenes Avant, de alta velocidad, pero no de AVE, con bastantes frecuencias diarias y amplio uso (vuelvo a ello enseguida). En 2012 y 2013, por iniciativa de la Junta de Castilla-La Mancha se pusieron unos trenes AVE Toledo-Madrid-Cuenca-Albacete que fueron un rotundo fracaso, y se eliminaron. En 2014, con motivo del año de El Greco, se pusieron unos trenes AVE desde Barcelona, Sevilla y Málaga, con parada intermedia en Madrid, que funcionaban en la práctica como dos trenes diferentes, ya que casi todo el pasaje que montaba en Toledo se bajaba en Madrid, donde el tren se volvía a llenar con destino a Barcelona, Sevilla o Málaga (y viceversa). Esos son los 220.000 pasajeros del AVE de 2014: en su inmensa mayoría pasajeros a Madrid que tomaban el AVE en lugar del Avant simplemente porque a la hora que ellos querían viajar ese era el tren disponible.

¿Pero cuántos pasajeros viajan en Avant entre Madrid y Toledo cada año? Pues en 2014 fueron aproximadamente un millón, que sumados a los del AVE supusieron 1.259.000 viajes entre las dos ciudades. En 2015, ya sin AVE, se llegó a 1,4 millones de pasajeros (unos 3.800 al día). Una distorsión similar se produce en Segovia, donde casi no paran trenes AVE, pero hay varios servicios Avant diarios, y también, aunque no tan pronunciada, en Valladolid, Ciudad Real o Puertollano.

Para la estadística de El País esos viajeros no cuentan, porque no son pasajeros AVE patanegra. Pero en una discusión que tiene como fondo las malas decisiones de gasto público al construir estaciones, no tiene sentido contar sólo a los pasajeros de un tipo de trenes. Aunque Renfe los cuente por separado, para preguntarse si se gastó bien el dinero en poner una estación en Segovia o en Ciudad Real habrá que contar todos los trenes y pasajeros, no solo los del servicio más caro.

El segundo problema de la noticia es la manera tan peculiar de calcular los pasajeros que usan las estaciones. Veamos lo que se dice en el texto sobre la estación de Villena:
En la estación de Villena, a 60 kilómetros de Alicante, levantada en un secarral a seis kilómetros del centro del municipio y sin transporte público para acceder a ella, paran cinco AVE por sentido en el trayecto entre Madrid y Alicante. Sin embargo, solo 25.850 viajeros compraron esos billetes en 2014.
Sin embargo, en el gráfico que aparece al pulsar en el mapa nos dice que el número de viajeros en Villena fue de 51.700. Exactamente el doble. ¿Qué está pasando? Pues una cosa muy absurda: para hacer la estadística de uso de las estaciones Renfe cuenta, lógicamente, todos los pasajeros que suben o bajan de los trenes en cada estación (es lo mismo que hacemos con aeropuertos, por ejemplo). Como cada pasajero sube en una y baja en otra, si se suman todos los usuarios de todas las estaciones nos da un número que es el doble del total de viajeros.

Así que, si a partir de los datos de las estaciones queremos saber cuántos viajeros hubo en España tenemos que dividir la suma por dos. ¡Pero para saber cuántos pasajeros pasaron por una estación no hay que dividir por dos el dato que da Renfe! Si de A a B viajan un millón de personas pasan, efectivamente, un millón por cada una de las dos estaciones, no medio millón. Pero eso es justamente lo que hace El País. Para saber cuantos pasajeros pasan al día por cada estación toman la estadística anual de Renfe, la dividen por dos, y luego por 365.

Por eso, según ellos, los 67.100 pasajeros de Guadalajara son 92 al día, y no 188. Y los 72.400 de Huesca son 99, en lugar de 198.  Y así sucesivamente. Sólo con esa lógica disparatada se puede decir que una de cada cuatro estaciones tienen menos de 100 pasajeros al día. Son ocho de 29 (27,6%). Pero si se cuenta bien, serían sólo 4 de las 29 (13,8%). Y de ellas, una es Segovia, donde según El País sólo pasan 14 pasajeros al día de AVE. En realidad son 28. Lo cual es muy poco, pero es que la mayoría de los pasajeros de esa estación son pasajeros de Avant, Alvia u otros trenes.

Así que si contamos bien los pasajeros de alta velocidad, todos, sólo serían tres estaciones (una de cada diez), las que en 2014 tuvieron menos de 100 pasajeros diarios. Sigue siendo una estadística mala, lógicamente. Pero no, no son una de cada cuatro. Y en realidad, no sé si el umbral de la infrautilización de una estación es de 100 pasajeros diarios, o de 500 o de mil. Pero en fin, si uno decide montar el titular sobre ese umbral, debería hacerlo bien.

Es una pena que El País haya conseguido unas estadísticas hasta ahora nunca difundidas por Renfe para estropear el relato de manera tan absurda. Los números (de algunas estaciones) son malos de por sí. No era necesario exagerarlos.

19 de abril de 2016

Déjà vu en El Mundo: los dinosaurios no se extinguieron por ese peazo de meteorito

El paleontólogo Luis Alcalá publica en Elmundo.es un interesante artículo sobre las últimas investigaciones en torno a la extinción de los dinosaurios: ¿Estaban ya sentenciados los dinosaurios antes de la caída del meteorito?

Desgraciadamente, alguien en El Mundo ha decidido encabezar el texto con esta imagen:

Imagen que representa un meteorito de muy grandes dimensiones, decenas o tal vez más de cien kilómetros de radio, impactando contra la tierra

Y con el siguiente pie: "Recreación artística del meteorito que acabó con los dinosaurios. EL MUNDO"

Exactamente la misma imagen fue utilizada en una noticia sobre la extinción de los dinosaurios por Elmundo.es en 2010, pero atribuyendo la autoría a la NASA.

Y en efecto, como conté entonces, sí, la imagen es de la NASA, concretamente el autor es Don Davis. Estaba alojada en un repositorio de imágenes que ya no funciona, y por eso tal vez alguien ha decidido que puede apropiarse de su autoría. Pero en realidad sigue disponible en la web de la NASA con clara indicación de sus propietarios intelectuales.

Y no, ni entonces, ni ahora, la imagen puede utilizarse como "recreación del meteorito que acabó con los dinosaurios", ya que este se estima que tenía unos 10 km de diámetro, y el de la imagen tendría más bien unos 500 km de diámetro, lo que significa que sería unas 125.000 más voluminoso, y su impacto probablemente acabaría con toda la vida en la tierra.

Pero claro, la tentación, en 2010 y en 2016, de poner una imagen chula, aunque sea errónea, sigue siendo demasiado fuerte.

5 de abril de 2016

¿Diámetro, circunferencia? ¡Qué más dará!

A menudo me ocupo en el blog de errores  en los que los periodistas incautos han sido víctimas de un engaño, inducidos a contar algo de manera distorsionada por una fuente interesada, cuyas trampas no han sido capaces de detectar.

Pero muchas otras ocasiones son los propios periodistas los que se meten ellos solitos en el lío, al interpretar una información que les ha llegado correctamente. Me ha mandado Juan Antonio (gracias) un ejemplo muy divertido de esta situación, publicado en La Voz de Avilés.

He aquí el encabezamiento de la noticia:

La Policía local recorre al año el equivalente a 18,2 vueltas al mundo

Alguien en La Voz de Avilés ha pensado que una manera de hacer más interesante, o tal vez más comprensible, la cifra de kilómetros recorridos por la polícia municipal (233.000 en números redondos) es compararla con los kilómetros que tendría una vuelta al mundo. Y ha calculado que 233.000 kilómetros son 18,2 vueltas al mundo.

Pero aquí viene el problema: una vuelta al mundo por carretera estrictamente no se puede dar, y aún combinándola con algún que otro trayecto en barco, se podría hacer por muchas rutas diferentes, a diferentes latitudes, y con diferentes longitudes. Hay que suponer que esa "vuelta al mundo" de referencia sería un recorrido alrededor del mundo, en cualquier vehículo, y que cubriera la distancia equivalente a un círculo completo alrededor de la tierra, sin cambiar de dirección. Como la tierra no es una esfera perfecta, esos círculos tienen varias longitudes posibles (muy ligeramente distintas), pero el que más se suele citar es el del ecuador, que mide, redondeando, 40.100 kilómetros. Esa es la cifra que típicamente se maneja al pensar en los kilómetros que mide la "vuelta al mundo".

Pero entonces, ¿cómo ha calculado La Voz de Avilés que 233.000 kilómetros son 18,2 vueltas al mundo? Pues muy simple, lo vemos en el primer párrafo:
... la memoria de la actividad policial durante el pasado año y que señala que los vehículos policiales realizaron una media mensual de 19.409,25 kilómetros (algo más de una vuelta al mundo ya que el diámetro de la tierra es de 12.742 kilómetros)...
Como lo leen: han pensado que el diámetro de la tierra (12.700 kilómetros) es lo mismo que la longitud de una vuelta al mundo. En fin, si te vas a poner creativo, mejor asegúrate de que lo estás haciendo bien. Que no requiere más que consultar un diccionario, o la Wikipedia, caramba.

1 de abril de 2016

El misterio de las cuentas de Twitter que difunden enfermizamente noticias de Abc.es

Un veterano lector del blog me ha alertado hoy de una cosa curiosa que le ha sucedido: le ha interesado una noticia del Abc, y quería saber qué decía la gente sobre ella en Twitter.

Para su sorpresa, se ha encontrado con docenas y docenas de tuits sobre la noticia, hechas por gente muy rara, con nombres impronunciables, supuestamente residentes en países sudamericanos (aunque el tema de la noticia era muy local), y cuyas cuentas de Twitter, con muchísima actividad, consistían al parecer, básicamente, en tuitear enlaces a noticias de diferentes medios, copiando su titular en el texto.

Me ha picado la curiosidad y he estado revisando el fenómeno. Y en efecto, he encontrado, a partir de la noticia en cuestión, al menos 40 cuentas de Twitter que la tuiteaban y cuyo contenido era casi exclusivamente enlaces a noticias de diferentes medios. Muchas de ellas tuiteaban noticias a un ritmo vertiginoso (varias por minuto), y además lo hacían por "paquetes", de manera que las mismas noticias se tuiteaban en muchas de las cuentas, exactamente en el mismo orden. Así, por ejemplo, esta cadena exacta de noticias la he encontrado repetida un montón de veces:


¿Qué curioso, no? Lectores de todo el mundo tuiteando exactamente las mismas noticias, en el mismo orden, con el mismo texto en el tuit (siempre el titular copiado)...

Obviamente, aquí hay gato encerrado. Estas cuentas son un cuento, y parece que estamos ante un fenómeno conocido. Igual que hay personas y empresas que compran seguidores falsos, para simular popularidad, hay también empresas que compran tuits automatizados, para generar apariencia de interés por sus contenidos. Hay incluso un blog (Twitter Bots) centrado en estudiar este fenómeno, con estudios de caso que se parecen bastante al que acabo de encontrar, utilizados fundamentalmente por partidos políticos y medios de comunicación (vean por ejemplo, este estudio sobre las redes falsas en las elecciones autonómicas del año pasado, o este sobre las andaluzas). 

Lo cierto es que en las cuentas que yo he visitado, hay pocas dedicadas exclusivamente a tuitear noticias de Abc.es (esta de @miamitop sería un ejemplo). En la mayoría aparecían, en diferentes combinaciones, muchos otros medios. La mayoría españoles, como infobae.es, eleconomista.es, elmundo.es,  meneame.net, 20minutos.es, eldia.es, elcorreo.com, mundodeportivo.com... Pero también otros Colombia, Venezuela, México o la República Dominicana. E incluso alguno que otro del New York Times, o CNN. 

Da toda la impresión de que estas cuentas son gestionadas automáticamente por alguien que vende sus servicios a muchos medios, o quizá entremezcle enlaces a fuentes que le pagan con otras que no lo hacen (esto parece que es típico, para camuflar un poco las trampas). En todo caso, da un poco de vergüenza ajena todo ello, ¿no les parece?

31 de marzo de 2016

¿Sólo Baleares y Madrid han salido de la crisis?

Lleva hoy El Mundo en portada esta extraña noticia:

Sólo dos de las 17 autonomías han salido oficialmente de la recesión en 2015 al registrar un PIB a precios corrientes superior al que tenían en 2008...

La información continúa en el interior, a cinco columnas, abriendo la sección de economía. Destaca un gráfico, que aparece también en la edición digital del periódico, que ilustra la variación del PIB nominal de cada comunidad autónoma y del conjunto del país, entre 2008 y 2015. Es este:

Puede verse que el PIB nominal ha crecido en Baleares y Madrid, y ha disminuido en las demás CCAA y en España
Son muchos los problemas de esta información. Veámoslos, de más a menos obvios.

1. Según el gráfico, el PIB del País Vasco habría pasado de 67.698 a 69.924 millones de euros. Esto representaría un aumento del 3,3%, el mayor de todas las CCAA, y sin embargo, en la última columna se dice que ha disminuido un 2,6%. Se trata de una simple errata: el dato de 2015 no es 69.924, sino 65.924, como puede verse en la fuente original (el INE), y el porcentaje de descenso del PIB nominal, 2,6%, es correcto. Ahora bien, una errata así sugiere que al hacer estos gráficos en El Mundo aún se "pican" los datos, uno a uno, manualmente, en lugar de copiarlos y pegarlos de las fuentes originales, que los dan en formato digital. ¿Cómo es posible?

2. Más serio es el lío conceptual. ¿Desde cuándo se dice que un territorio ha salido de una crisis económica cuando supera el nivel de PIB que tenía al inicio? Es una definición cuando menos inusual. Lo habitual es que digamos que una economía está en crisis cuando el PIB decrece, y que ha salido de la crisis cuando el PIB vuelve a crecer. Con una definición de ese tipo, claro, todas las comunidades autonómas habrían salido ya de la crisis. La mayoría de ellas en 2014, y alguna rezagada en 2015 (vuelvo al detalle de esto más abajo). 

En el texto de portada incluso se dice que las dos comunidades afortunadas "han salido oficialmente de la recesión". La expresión es chocante por dos motivos: primero, para hablar de que algo ha pasado "oficialmente", debe de haber alguna autoridad "oficial" que lo declare. No es así, claro. Ni el INE, ni el Banco de España, ni Eurostat, han hecho declaración oficial alguna sobre lo que afirma el periódico.

En segundo lugar, el término elegido, "recesión", se suele utilizar en el lenguaje económico con más precisión que el término "crisis". Se habla normalmente de que un país está en recesión cuando el PIB decrece dos trimestres consecutivos (dejo fuera un matiz importante, al que volveré enseguida). El problema es que la estadística del INE sobre el PIB de las comunidades autónomas no es trimestral, sino anual. No es posible saber en qué momento cada comunidad autónoma tuvo por última vez dos trimestres seguidos de disminución del PIB. Pero como sabemos que todas crecieron en el conjunto de 2015, a tasas considerables, y la mayoría lo hicieron también en 2014, más tímidamente, parece bastante seguro decir que todas las CCAA han salido ya de la recesión, entendida convencionalmente, y seguramente la mayoría lo han hecho ya hace casi dos años.

3. Pero aún queda por señalar el error más grave de esta noticia. Cuando se habla de crisis, o de recesión, de una economía, se habla de la variación del PIB en términos reales, no en términos nominales. Es decir, de la variación del PIB descontada la variación de los precios. Si en un país hay una inflación del 3% y el valor nominal del PIB crece el 2%, en realidad, en términos reales, el PIB no ha crecido, sino que ha disminuido. Ese país estaría en crisis, o en recesión (si al menos la caída se ha dado dos semestres seguidos, para mantener la definición anterior). Si con esa misma inflación del 3% el PIB nominal creciera el 5%, diríamos que la economía de ese país crece, pero no el 5%, sino más bien el 2% (en realidad el 1,94%, que es el resultado de calcular (105-103)103).

Y lo mismo pasaría si en lugar del PIB de un año respecto al anterior, comparamos el PIB de 2015 con el de 2008: para decidir si el PIB ha crecido o no es necesario descontar la inflación, y por tanto, aun si aceptáramos la inusual definición de "salir de la crisis" propuesta por El Mundo, basada en comparar el PIB de 2015 con el de 2008, lo tendríamos que hacer descontando la inflación.  Que un periódico que se pretende serio abra su sección de economía a cinco columnas, y lleve a portada, una noticia que ignora estas reglas básicas es simplemente incomprensible.

¿Y cómo calculamos esa variación del PIB real? Pues nos la da el propio INE, en la misma hoja de cálculo de la que ha extraído El Mundo sus datos, aunque un poco escondida. Junto a los datos del PIB nominal de cada comunidad, entre 2000 y 2015, aparece otra estadística, la "variación de volumen", de año en año, que es precisamente el crecimiento (o decrecimiento) de la economía, descontada la inflación (estimada a través de un indicador llamado "deflactor del PIB", que tiene un valor diferente al del IPC, puesto que este último mide sólo precios de productos de consumo, mientras que aquel estima la variación de precios de todo lo producido en la economía). Para calcular el efecto acumulado de esas variaciones anuales se puede aplicar al valor real del PIB de 2008 en cada comunidad autónoma, la variación anual, para llegar a obtener lo que sería el PIB de 2015 en euros constantes de 2008. El resultado de ese proceso aparece en la siguiente tabla, que recoge también la variación aparente, calculada originalmente por El Mundo

PIB por comunidades autónomas, en millones de euros constantes (2008) y su variación
Variación del PIB 2008-2015
Territorio20082015RealNominal
MADRID202.035203.1700,6%0,8%
CANARIAS42.58241.406-2,8%-0,6%
BALEARS, ILLES27.19426.421-2,8%1,3%
EXTREMADURA18.15517.529-3,5%-3,1%
NAVARRA18.73918.034-3,8%-2,6%
PAÍS VASCO67.69864.944-4,1%-2,6%
CATALUÑA209.005200.115-4,3%-2,1%
ARAGÓN35.61533.853-5,0%-5,1%
MURCIA29.13727.646-5,1%-4,8%
CASTILLA Y LEÓN57.09253.846-5,7%-5,3%
GALICIA58.58454.907-6,3%-4,9%
ANDALUCÍA152.137142.511-6,3%-4,7%
CASTILLA - LA MANCHA40.38937.709-6,6%-6,6%
RIOJA, LA8.2757.663-7,4%-3,6%
COMUNITAT VALENCIANA108.508100.316-7,6%-6,4%
CANTABRIA13.27912.015-9,5%-8,3%
ASTURIAS23.98921.582-10,0%-10,0%
Total Nacional1.116.2071.067.553-4,4%-3,1%

El resultado, como puede verse, no es dramáticamente distinto al de la gráfica publicada por El Mundo: casi todas las comunidades tienen valores algo peores, pero la diferencia es pequeña. Madrid es la única comunidad que ha superado el nivel del PIB de 2008, y Baleares, en cambio, pasa de un crecimiento del PIB nominal del 1,3% a una caída del PIB real del 2,8%. Que el cambio sea diferente en cada comunidad autónoma se explica porque el deflactor también es distinto (como lo es el IPC). El conjunto de España pasa de una caída del 3,1% al 4,4%. Por lo tanto, estamos algo más lejos de volver a los niveles de PIB de 2008 de lo que parece si miramos al PIB nominal.

Tal vez estén ustedes pensando que tampoco hay que montar tanto lío por diferencias tan pequeñas. Pero es que hay que subrayar que estas diferencias son tan escasas por accidente, por pura chiripa: el deflactor del PIB acumulado entre los años 2008 y 2015 es extremadamente bajo (aproximadamente el 1,3% para el dato nacional), mucho menor incluso que el inusualmente bajo valor del IPC, que en ese periodo acumuló una subida del 8%. 

Este es un dato absolutamente insólito históricamente. Lo "normal" es que en un periodo de 7 años la inflación acumulada sea muchísimo mayor. Por ejemplo, entre 2001 y 2008 el deflactor del PIB acumulado fue del 28,5%. Y en los siete años anteriores (1994-2001) fue del 25,8% (datos del Banco Mundial).

De manera que, por pura casualidad, esta vez, al estimar el crecimiento del PIB en siete años usando datos nominales, en lugar de datos reales, se comete un error pequeño. Pero lo típico hubiera sido cometer un error tremendo, del tipo creer que la economía ha crecido un 20% cuando en realidad ha caído un 5% o cosas similares (algo parecido le pasó a El País, hace años, cuando creyó que el PIB español se había doblado entre 1996 y 2006, y en realidad había crecido "sólo" en torno al 45%).

En fin, que El Mundo utiliza en su titular un concepto muy común con un significado muy diferente al habitual, generando bastante confusión. Y luego, al hacer su inusual cálculo, se ha librado, por pura casualidad, de una metedura de pata colosal. Haciendo bien las cuentas, y aceptando su concepto de "salir de la crisis", resulta que sólo lo habría hecho Madrid, la única comunidad que ha superado el nivel de PIB de 2008. Baleares en cambio está todavía a cierta distancia de hacerlo (la misma que Canarias). Y la mayoría de las comunidades autónomas están un poco más lejos de ese objetivo de lo que calculaba el periódico. Es decir, que la crisis ha sido incluso un poquito peor de la imagen, ya bastante gris, que nos proyectaba esta mañana el periódico. 

2 de marzo de 2016

No hagas predicciones, especialmente sobre el futuro

Ayer a la noche Eldiario.es publicó esta noticia (o análisis), que por casualidad yo he leído ya después de haber oído el discurso de Mariano Rajoy:

Rajoy tratará de modular su "no" a Sánchez para que no se vea como un portazo definitivo

La diferencia entre lo que aquí se propone y lo que acababa de oír me ha recordado el viejo dicho con el que he titulado esta entrada. Hay que recordar una vez más que el pre-riodismo es un género lleno de peligros. Puede discutirse que esto no es propiamente una noticia, sino más bien un texto de análisis. Es cierto, pero si lo leen verán que no se habla en términos de probabilidad, o de reflexión sobre lo que Mariano Rajoy debería hacer, o le conviene. Se habla, como en el titular, en tiempo futuro de indicativo, sobre lo que sucederá. Pues me parece que no ha sido exactamente así.

Cómo esforzarse para empeorar un gráfico

Un lector (gracias, Víctor) me alerta de este gráfico en la web de El País, que ilustra la importancia relativa dada por Pedro Sánchez a diversos temas en su discurso de investidura, a través del tiempo dedicado a cada uno:


La idea no es mala, ¡pero las barras no son proporcionales! Así, el único propósito del gráfico, ilustrar la importancia relativa de los temas, se pierde completamente. A simple vista se aprecia que no se guarda la proporción entre 17 y 20, ni entre 9 y 17, ni entre 4 y 9. Como consecuencia, también se puede apreciar a simple vista, y se puede comprobar con un programa que permita copiar y pegar fragmentos, que 17 más 4 parecen menos que 20, que 9 más 4 superan a 17, que los dos fragmentos de 4 minutos agregados quedan muy lejos del fragmento de 9 minutos...

En fin, un desastre incomprensible. Porque por defecto, cualquier programa dedicado a hacer gráficos los hace bien, proporcionales. Por lo tanto, para hacerlo mal hay que poner empeño, esforzarse. Y es difícil saber cómo se ha llegado a esto. No son barras truncadas, porque en ese caso lo que sucede es que las diferencias entre los números parece mayores que lo que realmente son.  O dicho de otra forma, las barras de los números mayores son mucho más grandes de lo que les correspondería, en proporción a las barras de los números pequeños. Y además el error es sistemático. Pero no aquí nada tiene mucho sistema: 4 es demasiado pequeña, comparada con 9; pero 9 es demasiado grande comparada con 17; que a su vez es demasiado pequeña, comparada con 20 y con 42...

Un caos. O un caso. En unos pocos minutos en Excel he conseguido una versión menos "artística" pero más fiel a los números que se quería representar.


Por qué y cómo para hacer el gráfico "bonito" se rompe la proporcionalidad entre las barras, y con qué propósito, si es que hay alguno, es un misterio para mi. Desde luego, la prisa no puede ser la explicación, porque por prisa se haría un gráfico simple, automático, y por lo tanto correcto. Aquí alguien se ha esforzado para modificar el gráfico automático, empeorándolo. Gran éxito.

[Nota: En la primera versión de esta entrada faltaba el enlace al texto de El País, que hay sido añadida después]

23 de febrero de 2016

Respuesta de uno de los autores del estudio sobre de la prostitución

Jorge Uroz es uno de los autores del estudio sobre la prostitución que dio pie, la semana pasada, a las noticias que afirmaban que un 20% de los españoles habían usado servicios de prostitución el año pasado, y que yo critiqué en mi anterior entrada de Malaprensa. Ha respondido a mi texto y a algunos de los comentarios, a través, a su vez, de una serie de comentarios a la propia entrada.

Agradezco mucho su aportación, y para facilitar la mayor difusión, coloco a continuación todos sus comentarios encadenados en una entrada propia, que será así más fácil de enlazar.

******************************************
Estimados lectores de malaprensa: mi nombre es Jorge Uroz y soy uno de los autores del informe “Apoyando a las víctimas de Trata” cuya presentación se realizó el pasado viernes 19 de febrero. Me ha parecido honesto participar en su foro para concretar, puntualizar y aclarar algunas de las informaciones y posibles malos entendidos que se están comentando en su foro sobre la investigación y sobre la difusión que se ha realizado en los medios de ella. Intentaré ser lo más sintético posible:

1º Me gustaría dejar claro por encima de todo que el objeto del estudio no era cuantificar el número de personas que hacen uso de servicios de prostitución (clientes), si no hacer un análisis de las necesidades de las víctimas de trata o si quieren ustedes de las personas que se ven obligadas y coaccionadas a ejercer la prostitución. Si se le echa un vistazo al estudio de las 200 hojas, más de 140 hojas desarrollan las necesidades de las mujeres y las intervenciones que las ONG hacen con ellas y sólo unas 30 hojas se dedican a los clientes.

2º El objeto del análisis de los clientes sólo tenía como cometido ver en qué medida los clientes de prostitución podrían ser colaboradores en la denuncia o cómo se podrían implicar en caso de que detectaran una situación de trata, para erradicar este drama humano. Lo realmente importante no es cuántos clientes hacen uso de servicios de prostitución, que de hecho no era objetivo del estudio. Por esa razón la encuesta que se realizó no era representativa, aspecto que comentamos en más de una ocasión, aunque fuera una encuesta con una muestra muy muy amplia a pesar de no ser representativa.

3º El titular “El 20% de los españoles han sido clientes de prostitución en el último año” no es exacto si atendemos sólo a la encuesta hecha en el estudio a hombres o si ustedes quieren decir que ese titular es extraíble de los datos de la encuesta a hombres. ¿Ese titular es fruto de mala praxis profesional o de un sesgo por parte del equipo de investigación? pues permítanme que les diga que creo que fue sólo causa de un mal entendido o mala interpretación de los datos ofrecidos. Nuestro equipo estaba refiriéndose a que el 20% de quienes dicen haber hecho uso de la prostitución alguna vez en la vida volvía a confesar que había ido en el último año. Porque lo que nos interesaba eran los clientes (no los españoles en general). Ahora en la rueda de prensa algunos compañeros insistieron sobre si eso podría ser posible, que el 20% de los españoles pudieran estar haciendo uso de estos servicios, a lo que contestamos que podría ser posible, que no era algo descabellado pensarlo, pero en ningún caso refiriéndonos a datos de la encuesta. Luego aclararé más este punto para que todos los lectores y el compañero que se sintió engañado por nuestra parte en la rueda de prensa tenga más datos.

4º Lo que si dejamos claro, en reiteradas ocasiones es que no deberían hacerse cálculos sobre la base de una muestra no representativa, independientemente de los resultados que allí se mostraran. La realidad de los hechos es que si un estudio no es representativo no se puede generalizar.
Al mismo tiempo, sí procuramos puntualizar que los resultados que salieran en la encuesta (independientemente del dato concreto que sea) sólo eran la punta del iceberg, es decir, en realidad el dato de hombres consumidores de prostitución cada año será mucho mayor que lo que nosotros podamos mostrar en una encuesta.

Ante el estupor de algún periodista que cuestionaba si era posible que cuatro millones de españoles pudieran hacer uso en el último año de servicios de prostitución, procuramos matizar que no eran descabellados esos datos. En base a otro tipo de informaciones que este este equipo tiene. Estos datos no están señalados exactamente en el estudio porque como ya hemos dicho nuestra intención no era cuantificar ni hablar sobre cuántos hombres españoles hacen uso de estos servicios. Tampoco todo puede ser publicado en un informe oficial como ustedes podrán imaginarse. Y por supuesto estos datos no son extraíbles de la encuesta a hombres. Si cualquier profesional de los medios de comunicación nos hubiera pedido que le explicáramos cómo podríamos hacer una estimación así, no habríamos tenido problema alguno en hacerlo, aunque es lógico que tanta argumentación no pueda hacerse en una rueda de prensa breve y concisa. Como bien dicen ustedes la inmediatez de su profesión hace que en estos eventos no se pueda argumentar ni se piden explicaciones suficientes para que no ocurran posibles malos entendidos. Ahora bien, los miembros de este equipo estuvimos repartiendo tarjetas con nuestros datos de contacto a aquellos compañeros que nos las solicitaron por si querían explicaciones más detalladas sobre algunas de las cosas que allí se dijeron o dudas que pudieran surgir en otro momento. Algunos de esos compañeros sí han hecho uso de ellas y se han puesto en contacto con nosotros pidiendo algunos detalles que les hemos ofrecido.

5º Como equipo con una experiencia extensa en el estudio de poblaciones ocultas, sabemos que una encuesta a población masculina sobre uso de servicios de prostitución va a estar sesgada. Los hombres españoles no van a reconocer el uso de estos servicios por mucho que nadie se empeñe en preguntarles. Nuestra forma de trabajar es hacer triangulación de datos, es decir, al igual que ustedes, poder contrastar otras fuentes de información para acercarnos lo más posible a la realidad de los hechos. Esto no es posible explicarlo en una rueda de prensa donde la rapidez y la brevedad del tiempo, impone que se vaya a afirmaciones sin poder hacer extensas justificaciones.

Para saber de la veracidad de los datos ofrecidos por los encuestados, en primer lugar en la propia encuesta telefónica ya hicimos preguntas para establecer la coherencia de los entrevistados, y ya pudimos observar cómo los hombres mienten sobre el uso de estos servicios. Pero además las entrevistas en calle nos confirmaron este hecho porque alrededor del 50% de hombres que inicialmente decía que no había hecho uso de estos servicios en el último año, a lo largo de la entrevista (que es más profunda y con características diferentes a un cuestionario) acababa por reconocer que sí había ido aunque inicialmente nos hubiera negado hacerlo. Esto significa que para saber cuántos españoles hacen uso de estos servicios, jamás podremos confiar en una encuesta por muy representativa que esta sea. La población masculina mentirá sobre este hecho en concreto siempre.

6º Para nosotros como equipo lo más importante de este estudio les vuelvo a reiterar que no es cuanta población masculina puede hacer uso de estos servicios. En este sentido sí discrepamos o tenemos visiones diferentes sobre lo que debería haber sido un titular de la noticia. Es obvio que lo que a nosotros nos parece más interesante resaltar no es lo que les parece a los profesionales de la comunicación. Por otra parte, lo que sí parece también un poco censurable es que ustedes nos hayan condenado sin mediar palabra con nosotros sobre esa posible confusión del trabajo y sobre lo que allí se dijo. Posiblemente la inmediatez de su trabajo les haga actuar en este sentido. En lugar de pensar que este equipo de investigación comprometido (nadie del equipo ha ganado un euro por el trabajo realizado) fue quien indujo a dar noticias y datos falsos deberían haberse puesto en contacto con nosotros para aclarar las posibles confusiones. Sobre todo el compañero que sintió engañado por nosotros al estar presente en aquella rueda de prensa. Nosotros desconocíamos cual iba a ser el titular de la noticia. También les digo que como investigadores jamás hubiéramos sacado ese titular en concreto, había cosas mucho más interesantes y más centradas con el objeto de investigación que resaltar como titular de la noticia, desde nuestro modesto entender. Pero no entro a valorar cómo los profesionales de este ámbito realizan su trabajo, sencillamente señalo que nosotros hubiéramos hecho algo diferente.

Si el titular que salió fuese del todo incorrecto, les aseguro que habríamos sido nosotros mismos los que nos habríamos puesto en contacto con los medios para señalarlo. Digamos que no era del todo correcto en aquellos casos en los que se dio a entender que eso era fruto de la encuesta realizada.

Este equipo a lo largo de su trabajo de investigación, trabajo que no está concluido porque como equipo ha continuado trabajando hasta el día de hoy en el tema y sigue obteniendo resultados que no están en el informe publicado (un informe que se entregó hace más de un año y medio), ha hecho estimaciones no basadas en una encuesta para poder determinar una posible cifra de hombres consumidores de estos servicios, sin que sea lo relevante para nosotros

¿Cómo le consta a este equipo el posible número de clientes que cada año hace uso de estos servicios, para que le rueda de prensa se dijera que el dato no era del todo descabellado? Vayamos a algunos datos publicados en el informe, y otros datos no publicados que este equipo tiene. Aunque les reitero que nuestro cometido jamás fue cuantificar. Sin embargo si ustedes están tan interesados sólo en los datos de tipo cuantitativo aquí les ofrezco nuestras estimaciones: 
En España según datos oficiales de la UCRIF en 2013 existen 1670 clubs, dato que publicamos en el informe (no estamos hablando de prostitución en pisos, casas, o calle). En los clubs existe una media de 20 mujeres (algunos llegan a tener 80 mujeres mientras otros tienen solo unas 5) lo que supone unas 33.800 mujeres ofreciendo servicios sólo en clubs. Cada mujer ofrece una media de 10 servicios a clientes semanalmente (información contratada por este equipo de investigación a través de diversas entrevistas y trabajo de campo) y por otros estudios diferentes del nuestro hechos sobre el tema. Eso significa que existen unos 338.000 clientes cada semana que en nuestro país hacen uso de este servicio. Si ese dato lo calculamos en un año (52 semanas) tenemos una media de 17.576.000 clientes por año. Ahora bien, evidentemente un cliente puede repetir haciendo uso de varios servicios al año. En nuestro estudio también señalamos que la media de dinero gastado en el último año en prostitución que los clientes declararon haber hecho oscila entre 120 euros (los clientes encuestados en CATI) y los 330 euros (los clientes entrevistados en la calle). La media de los servicios de prostitución viene a ser unos 50 euros por servicio. Eso supone que en el último año algunos clientes dicen haber ido unas 2 veces y otros clientes dicen haber ido unas 6 veces… si nos quedamos con una media de cuatro servicios al año por cliente, y ustedes mismos hacen la división eso nos deja una cifra de cuatro millones de clientes al año en servicios de prostitución en clubs. A esto tendremos que añadirle los clientes que visitan a las mujeres que ofrecen estos servicios en pisos, casas y calle… hagan ustedes mismos posibles cálculos para acercarse a la magnitud de los datos. 

Para que podamos ajustarnos a datos ya ofrecidos o contrastados les remito al estudio realizado en 2005 “Impacto de una posible normalización profesional de la prostitución en la viabilidad y sostenibilidad futura del sistema de pensiones” realizado por Gabriella Malgesini para el Ministerio de Trabajo y Asuntos Sociales. En ese estudio se calcula que existían en 2005 en España unas 113.426 mujeres que ejercen prostitución en nuestro país (posiblemente los datos pasados 10 años hayan ido a más pero incluso quédense ustedes con esa cifra anterior). Calculen la media de 10 servicios por más de cien mil mujeres semanalmente y hagan una estimación de cuantos hombres podrían estar haciendo uso de estos servicios cada año… Un 20% de hombres no es una estimación disparatada en función de estas estimaciones (un 3% de hombres ni se acerca a la realidad). Pensemos que algunos hombres son consumidores de prostitución con cierta frecuencia mientras que otros sólo hacen un uso esporádico de este servicio quizá una sola vez en el año. Quédense con una media de cuatro servicios anuales y hagan ustedes cálculos como les he dicho con las cifras totales de mujeres que hay ejerciendo no sólo con las mujeres en clubs. De ahí es de donde este equipo tenía hechas las estimaciones sobre ese dato que tanto les interesaba.

7º Por último sólo volver a reiterar que no era nuestro interés conocer cuántos hombres pagaban por servicios sexuales de la población española masculina, sino hablar de las necesidades de las personas que se ven obligadas y coaccionadas de formas terribles a ejercerla. Nuestro acercamiento al cliente estaba motivado como posible agente de detección de víctimas y colaboración con las Fuerzas y Cuerpos de Seguridad del Estado. Más allá de los titulares, agradecemos a la prensa y a los profesionales de los medios de comunicación que se hayan hecho eco de esta realidad, y en el desarrollo de las noticias se hayan centrado más en la realidad de los hechos que realmente son importantes. Y por supuesto y lo que es fundamental para nosotros que ustedes hayan contribuido con su labor a sensibilizar a la población de la existencia de este drama humano que era el único objetivo de este equipo con su trabajo, un mejor conocimiento y una mayor visibilización de esta realidad.

Un cordial saludo a todos los lectores

19 de febrero de 2016

¿20% de clientes de prostitución el último año? No, claro, ni mucho menos

Me empiezo a sentir viejo cuando veo que puedo escribir una entrada de Malaprensa como si estuviéramos en 2005. Nada ha cambiado. Mismas trampas, mismos errores, mismos temas, mismos periodistas pardillos... En fin, les cuento.

Paso 1.
Hace unos minutos me escribe mi viejo amigo Wonka alertándome de esta noticia de Elmundo.es:

Me dice: aún no he podido leerla, pero tiene muy mala pinta.

En efecto, basta con un poco de sentido común para dudar de una información así. El crap detector se dispara.

Paso 2.
Leo la noticia, y veo que los autores del estudio piensan que la cosa puede ser incluso peor, en el típico argumento de "punta del iceberg":
Según los autores del informe, si bien la muestra no es del todo representativa, podría suponer mucho más: "Que un 20% de los encuestados se atreva a reconocer algo que está siempre tan oculto, indica que deben ser muchos más quienes han pagado por servicios sexuales en España".
Lo de la "muestra no del todo representativa" me hace saltar más alarmas. Pero luego veremos que en realidad no es el mayor problema de la información.

Paso 3.
Veo si hay más medios que cuentan algo parecido. ¡Claro, cómo no! ¡Quién se va a resistir a un titular así! Lo lleva El Comercio de Gijón, 20 Minutos, Abc.es, Antena 3... También titula así la Agencia Efe, que quizá sea de quien beben los otros medios.

Otros como El Diario de Sevilla,  el Huffington Post, Tele5, dicen que ese 20% ha pagado "recientemente". Tal vez el olfato les ha dicho que algo huele mal en la noticia, y se han querido curar en salud. Pero no han hecho bien su trabajo.

Paso 4.
Busco el estudio. No sale buscando directamente el título en Google (en los primeros resultados, que son las propias noticias sobre el mismo). Pero sí sale, fácilmente, cuando voy a la web del Ministerio de Asuntos Sociales, y en unos seis-ocho clicks encuentro la sección de Estudios e Investigaciones, dentro de la sección dedicada a Violencia de Género (en la que dicen las noticias que está encuadrado el estudio). En el índice por años voy a 2015, y el primero de la lista es el informe buscado.

Ahora hay que husmear un poco por él. Es largo. Pero tiene índice. Y es un pdf en el que podemos buscar la aparición de diferentes palabras. Total, que en pocos minutos encuentro el texto completo de la encuesta. Estas son las preguntas relativas a si el entrevistado ha pagado servicios de prostitución:

Hay dos preguntas: si ha pagado alguna vez y si lo ha hecho en el último año

Y así es como se resumen los resultados de la encuesta en la página 162 del informe:

Los que han pagado alguna vez son el 20,3% o el 17,1%, en dos submuestras distintas

¡El 20% que citan todos los titulares son las personas que han pagado alguna vez por servicios sexuales, no los que han pagado el año pasado!

(Lo de las dos submuestras es demasiado largo para explicarlo aquí. Lo cuentan en el informe. En todo caso, es la muestra telefónica con CATI la que podría estar más cerca de ser una muestra representativa).

Pero esperen, porque en el informe se da también el dato de los que han respondido afirmativamente a la segunda pregunta, es decir, los que han usado los servicios de prostitución el último año (pág. 176): son 25 de los algo más de mil de la muestra CATI. Es decir, el 11,7% de los que alguna vez han usado esos servicios. Es decir, los que dicen que han pagado por servicios sexuales en el último año son el 2,4% de la muestra CATI.

Es decir, unas 8 veces menos que lo que dicen ahora mismo tantos y tantos titulares.

Paso 5
Como siempre, lamentarme de que las cosas se hagan tan mal, con tan poco esfuerzo, con tan poca cabeza. Y preguntarme por el proceso exacto que lleva a este error. ¿Una nota de prensa mal redactada? ¿Una expresión confusa en una nota de prensa? ¿Un periodista adormilado que toma mal las notas de una presentación oral? Lo curioso es que tantas y tantas veces los errores son en la dirección de exagerar las cosas, a peor, en la dirección escandalosa y amarillista. Bueno, tal vez esté usando una muestra sesgada, porque esos son los errores en los que yo me fijo, e investigo. A lo mejor hay muchos otros en la otra dirección de los que yo no me entero. Tal vez.

Actualización: lean el comentario de B, que estuvo en la rueda de prensa. ¡Parece que la fuente del error son los propios autores!

Segunda actualización (24 feb): en los comentarios responde también, en varias partes, uno de los autores del estudio. He compilado su respuesta completa en esta nueva entrada del blog.