28 de mayo de 2020

El New York Times también lleva falacias en portada

Hemos hablado muchas veces en este blog de la falacia de los números absolutos, o el síndrome de "Andalucía encabeza" que dice mi amigo Juanjo Gibaja. Se trata del error de comparar en números absolutos cuánto pasa un fenómeno (da igual que sean coches vendidos, divorcios, enfermos de cáncer o estudiantes universitarios) en lugares con tamaños de población muy diferente. Eso no tiene sentido. Hay que acudir siempre a los números relativos, a las tasas: por 100, 1.000 o 1.000.000 de habitantes. Sólo así la comparación tiene lógica.

Y así, con los datos del covid-19, por ejemplo, no tiene lógica, sin más, decir que España tiene muchos más casos o fallecidos que Portugal. ¡Cómo no iba a tenerlos, si tiene más de cuatro veces más habitantes! Lo que tiene lógica es comparar las tasas de casos o  fallecidos por millón de habitantes... y ahí se ve que sí, que tenemos muchos más que Portugal también en relación a la población, y por tanto, tiene sentido preguntarse qué hemos hecho mal, o qué han hecho ellos bien, en relación con la epidemia.


Pues bien, desde hace semanas llevo viendo en los medios norteamericanos (o tal vez solo los progres) infinitas referencias a la situación del covid-19 en Estados Unidos que mencionan el hecho cierto, pero engañoso, de que es el país del mundo con más casos, y más fallecidos, por covid-19.Y en efecto, por lo que sabemos hasta ahora, lo es. Pero ese dato es poco informativo porque Estados Unidos es uno de los países con más población del mundo, y de lejos el más poblado entre los países ricos en los que, hasta ahora, con alguna excepción, se ha centrado la pandemia.

Por eso me produce tremenda decepción que el New York Times llevara anoche en la cabecera de su página web este texto:

Decir que la "death toll" (el número de víctimas) en Estados Unidos es "mucho más alto que en cualquier otra nación" es, en sentido literal, cierto, pero engañoso. Lo relevante para saber cómo de "grave" es la epidemia en un país no es el número total de víctimas. Es el número en relación a la población: y ahí Estados Unidos está todavía bastante mejor que unos cuantos países del mundo. Como se ve en este gráfico que he generado en la página de Our World in Data, con el número de fallecidos por millón de habitantes en varios países del mundo:



Destacar en un titular de portada que el número absoluto en Estados Unidos es el mayor del mundo es un engaño a los lectores impropio del periódico que pasa por ser uno de los mejores del mundo.


14 comentarios:

  1. La crítica a los números absolutos es adecuada en la mayoría de los casos, pero no en todos, y no en este. La crítica tiene sentido en fenómenos que se distribuyen uniformemente; las epidemias sin embargo son fenómenos de crecimiento (exponencial para más inri) a partir de focos: no tiene sentido en estos casos hacer comparaciones respecto a un área o población arbitraria. Pensemos en cómo medir el gran foco chino. Por habitante de Hubei? Por habitante de Wuhan? Por habitante de China? Parece absurdo relativizarlo a toda la población China, 100 veces mayor. En el caso de las epidemias además hay un segundo factor de no uniformidad, que es la relevancia de la densidad de población. Sin duda un foco en dos puntos equivalentes en todos los sentidos excepto en su densidad de población crecerán a velocidades distintas y por tanto hacer comparaciones, relativas o absolutas, sin tener en cuenta esta variable es también desaconsejado.

    La realidad es que el titular de NY Times en números absolutos si tiene importancia periodística en un pais en el que las autoridades han negado la gravedad de la epidemia. El hecho de que como pais tengan una incidencia media menor que España por ejemplo significa muy poco. Y significa poco porque es una medida arbitraria; si en vez de EEUU comparamos solo el estado de Nueva York con toda España se da la vuelta a la tortilla. Y asi ad infinitum: podemos comparar NY solo con Madrid, o Madrid solo con Manhattan.

    ResponderEliminar
    Respuestas
    1. Lo siento, no me convences.
      Acepto que me digas que la relación con la población no es la única cosa que hay que mirar (por ejemplo, como dices, por la cuestión de la densidad de población).

      Pero no tiene sentido decir que no haya que mirarlo, sobre todo a la hora de hacer un titular, que subraya que algo es noticioso. La "noticia" no es que Estados Unidos tenga más casos que otros países (lo que es totalmente esperable). La noticia puede ser, si quieres subrayar que no se ha hecho bien, que tiene más casos, por habitante, que países como Alemania, Japón, Corea del Sur o Australia.

      Eliminar
    2. Estaría bien que explicases qué no te convence ¿Porqué crees que si quieres subrayar que no se ha hecho bien, es más adecuada la medida por habitante? Mi argumento es que la medida relativa por paises es arbitraria en procesos no uniformes como una epidemia, en qué estoy equivocado? Realmente crees que el hecho de que Brasil tenga una mortalidad relativa baja dice algo sobre lo bien que se está gestionando la epidemia en Brasil?

      Eliminar
    3. Sí, en procesos no uniformes como una epidemia, hay elementos azarosos y no uniformes, focos antes en unos sitios que en otros, que pueden explicar, seguramente, la diferencia entre Roma y Milán, o entre Madrid y Valencia, por poner un ejemplo.

      Pero yo no habloa de explicaciones, sino de descripciones. Donde va mejor la cosa (hasta ahora) y donde va peor. Para decir, siquiera "hasta ahora la epidemia va mejor en Valencia que en Madrid" tengo que hacer referencia a la población.

      O tal vez pienses que eso no se puede decir o no tiene ningún sentido. La epidemia va peor que en Madrid, porque hay más muertos. Y va también peor en Andalucía que en La Rioja, porque hay más muertos. Ambas afirmaciones son igualmente válidas, porque el tamaño de la población de esas cuatro comunidades es irrelevante, supongo, según tu criterios.

      Eliminar
    4. No estoy diciendo que el valor relativo en general sufra de artefactos como los que sufre el valor absoluto ( que también, supongo que lo llamarías el sindrome de "Luxemburgo encabeza"). Estoy diciendo que en los procesos de crecimiento en concreto los valores relativos no tienen sentido porque el denominador se puede elegir de manera arbitraria; ya lo he explicado con el ejemplo de China. Por poner otro ejemplo, cuando una gota cae en una superficie de agua, las ondas viajan a la misma distancia en un lago que en una piscina; no nos dice nada que el segundo caso recorra 10000 veces más superfie en terminos relativos. El valor absoluto sin embargo si nos puede dar información; si una onda recorre más superficie en términos absolutos significa que la gota era más masiva o veloz. Por eso el titular del NY Times si contiene información, o desde luego más información que si se hiciera la comparación en términos relativos.

      Por eso no se deben hacer comparaciones relativas con el covid, o al menos no a la ligera (como el grafico de ourworldindata). Es innegable que la portada del NY Times no es una publicación científica; 100.000 muertos tiene valor periodístico, no científico. Pero no es para nada un titular engañoso. Al contrario, en el caso concreto de EEUU la mortalidad por habitante si sería engañosa: EEUU, Brasil o China no deben poder esconderse detrás de su masiva población.

      Eliminar
    5. No es verdad que el denominador se pueda elegir de manera arbitraria. Una vez que escoges las entidades que quieres comparar, el denominador es el que es. Puedes decir que no es adecuado comparar países pero eso sólo es una crítica más al NYT. De todas formas, comparar países es lo habitual.

      El ejemplo de la piscina no es válido porque estás asumiendo que sólo cae una gota en cada superficie, es decir, que sólo hay un punto de entrada por país. Eso no es así. Hay muchos puntos de entrada y lo razonable es pensar que eso está también en proporción a la población. Caen más gotas de lluvia en un lago que en una piscina.

      ¿Qué información da el dato de que en Grecia hay más muertos que en Andorra? Ninguna. ¿Qué información da el dato de que en Italia hay más muertos que en Grecia? Ninguna. Sin embargo, el dato de que en Italia hay muchos más muertos por habitante que en Grecia sí que da mucha información sobre lo que ha pasado. A día de hoy, es evidente que los números de Brasil son mucho mejores que los de Italia, por ejemplo. Habrá que ver cuando acabe todo, y en cualquier caso, eso no implica que la gestión haya sido mejor. Hay un salto muy grande entre tener mejores números y haber hecho una gestión mejor.

      Se puede decir que es muy complicado y hay muchos factores pero eso solamente hace más ridículo el titular simplista del NYT.

      Eliminar
    6. Vaya por delante mis disculpas por reflotar un tema antiguo, pero llevo días dándole vueltas al sin sentido de comparar países o comunidades autónomas en base a la población total.

      Como se ha comentado anteriormente, no es lo mismo una enfermedad que tiene una incidencia más o menos uniforme en toda la población (por ejemplo, el cáncer) que la incidencia de una pandemia, que se expande por focos o brotes de infección. Medir la incidencia de una pandemia en base al total de la población es tan caprichoso como medirla en base al número de coches rojos, porque no hay una correlación directa entre población total y el número de contagiados o fallecidos. Esto hay varios periodistas especializados (como John Burn-Murdoch del FT) que lo llevan diciendo desde el principio y demostrándolo con datos: los fallecidos o contagiados tienen una correlación muy débil con la población total. La correlación es un poco más alta con densidad, pero tampoco parece que la densidad sea un factor demasiado decisivo en base a los estudios (podemos ver que la provincia española con más incidencia es Soria y tenemos el caso de Japón como extremos).

      Pero más allá de estos estudios basados en datos (que llevan años aplicándose en otras pandemias), es una cuestión de sentido común. Medir la incidencia en base a la población total solo tiene sentido por foco o por entidades bastante homogéneas en cuanto a cantidades de contactos de riesgo que un contagiado puede tener, como por ejemplo Madrid, Nueva York, Barcelona o Madrid. Sabemos que hay una tasa de contagio o de transferencia (R0) que depende del número de personas que un contagiado puede contagiar. Y sabemos que ese R0 se mantiene bastante constante en situaciones en las que el contagiado tiene suficientes posibilidades de contagiar. Es decir: si un mismo contagiado vive en Madrid, Nueva York, Barcelona o Valencia, con bastante probabilidad contagiará al mismo número de personas. En cambio, si esa misma persona está en Memphis contagiará con absoluta seguridad menos personas al haber un distanciamiento social evidente.

      SI una persona contagia a, por ejemplo, 4 personas en Madrid y de éstas muere 1... cuál es el motivo por el que las 4 personas que ha contagiado EL MISMO emisor "cuentan" menos que las que ha contagiado en Barcelona? Con qué base lógica podemos afirmar que el lamentable deceso en Madrid es menos importante que el de Barcelona? Qué tiene que ver en la incidencia de esa transferencia del virus los habitantes de Lleida o de Chinchón?

      Si un atentado terrorista tiene 100 víctimas en Madrid y 100 en Barcelona, realmente podemos medir la incidencia del atentado en base a la población total de la comunidad?

      Eso por no hablar de factores que SI son relevantes, como la pobreza (viviendas pequeñas con exceso de residentes, uso de transportes públicos masivos vs desplazamiento en vehículo propio, taxi o teletrabajo....), cantidad de personas vulnerables por edad o por problemas respiratorios previos, temperatura, camas de hospital por habitante, distancia media a los hospitales....

      Creo que de entrada no tiene ningún sentido comparar comunidades ni países en una economía y sociedad global. ¿Acaso el virus entiende de fronteras? Pero si se quiere entrar en el aberrante juego de clasificar las regiones o los países, evitemos este indicador absurdo. Creo que usted es un buen altavoz para acabar con el sinsentido de que unos muertos cuenten más que otros dependiendo de dónde vivan.

      Gracias por dejarme expresarme, mucha salud y endavant!

      Eliminar
    7. Reducción al absurdo. Si mañana Madrid se independizase... habría cambiado de un día a otro la eficacia en la gestión de la pandemia en España?

      Eliminar
  2. Estos argumentos no tienen sentido.
    Es el propio NYT quien ha escogido comparar países. Si no es adecuado, será un problema más de su artículo, en ningún caso una defensa.
    Y lo mismo pasa con la densidad de población. Si es un dato a tener en cuenta (es discutible pero no voy a entrar en eso) entonces es un problema más del artículo. ¿Qué clase de razonamiento es ése? "El artículo está bien porque además de no tener en cuenta la población tampoco ha tenido en cuenta la densidad de población". ¿En serio?

    ResponderEliminar
  3. La RAE ha determinado que covid-19 debe ser, en español, una palabra femenina (la covid), ya que se trata de una enfermdedad.

    ResponderEliminar
    Respuestas
    1. Sí, eso entendí yo al principio, y me sonaba raro (aparte de que ahí la RAE parecía ir contra el uso dominante).
      Lo he buscado ahora y he encontrado esto en su web:
      https://www.rae.es/noticias/crisis-del-covid-19-sobre-la-escritura-de-coronavirus

      El acrónimo COVID-19 que nombra la enfermedad causada por el SARS-CoV-2 se usa normalmente en masculino (el COVID-19) por influjo del género de coronavirus y de otras enfermedades víricas (el zika, el ébola), que toman por metonimia el nombre del virus que las causa. Aunque el uso en femenino (la COVID-19) está justificado por ser enfermedad (disease en inglés) el núcleo del acrónimo (COronaVIrus Disease), el uso mayoritario en masculino, por las razones expuestas, se considera plenamente válido.

      Eliminar
  4. Si el numero de víctimas en estados unidos es más alto que el de cualquier otra nación, es este articulo el que lleva falacias de titular.

    ResponderEliminar
  5. Pongamos un escenario en el que surge un brote en Valencia, otro en un pueblo de Albacete de 1000 habitantes y otro en Madrid, con exactamente la misma carga viral.

    En el caso de Madrid y Valencia, la capacidad de transmisión del virus está garantizada por contacto social, por lo que el R0 será prácticamente el mismo en ambos brotes, si los hábitos sociales y profilácticos son los mismos.

    En cambio, en el pueblo de Albacete, el virus solo consigue contagiar a las personas que frecuentan club social de mayores. En total, se contagian 50 mayores, de los cuales fallece el 20% (10 decesos).

    En Valencia y Madrid el R0 comienza hacer sus diabluras y se produce un crecimiento exponencial idéntico. Pero en Valencia confinan inmediatamente y eso hace que, cuando en ambos brotes se habían contagiado 50.000 personas, que el R0 de Valencia se reduzca de forma dramática y finalmente se contagien 100.000 personas. En cambio, en Madrid no se toman medidas y se contagian 500.000. En ambos casos, la mortalidad es similar y de un 5%, por lo que fallecen 5.000 personas en Valencia y 25000 en Madrid.

    En los noticieros, se habla de tasa de mortalidad (por 100.000 habitantes):
    - Pueblo de Albacete: 1000
    - Valencia (1.000.000 habs): 500
    - Madrid (10.000.000): 250.

    Felicitaciones, Madrid!

    No tiene sentido

    Enhorabuena por tu magnífico blog!

    ResponderEliminar
    Respuestas
    1. Gracias por el ejemplo, pero al simplificar en un solo caso pierde fuerza (mejor sería pensar en miles de focos simultáneos), y además es simple darle la vuelta. Si por ejemplo los contagios en el pueblo de Albacete se deben a que tienen un Bolsonaro y no toman ninguna medida, si no hablamos de tasa de mortalidad por 100.000 sino de cifras absolutas, nada que reprochar al Bolsonaro local (Felicitaciones Bolsonaro!!) puesto que solo tienen 10 muertos frente a los 5000 y 25000.
      Que todo es relativo es una de las pocas verdades absolutas. Y que sobre esta pandemia es raro encontrar a quien la mire por encima de su propia ideología.

      Eliminar

Gracias por participar. Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti, y tus comentarios no se confundan con los de otras personas.
Los comentarios de las entradas menos recientes son revisados por mí y no se publican inmediatamente.