10 de julio de 2020

No, el coronavirus no avanza esta semana como lo hacía a principios de marzo

No sé muy bien cómo el Abc publicó ayer una noticia con este impactante titular:

El coronavirus avanza en España con una curva similar a la de principios de marzo

Que se ilustra con este no menos impactante gráfico:

La noticia lleva muchas horas siendo la más leída en la página web de Abc, supongo que en gran medida por su difusión en redes sociales, en la que debe de estar corriendo como la pólvora.

Pero resulta que en la noticia, y en el gráfico, está prácticamente todo mal. Así que voy a intentar explicarlo, en tres partes.

1. Los datos no son correctos


Pasando el ratón por encima de la gráfica original de Abc se pueden ver los datos exactos utilizados para crearla, que son estos:

Tabla 1. Datos gráfico Abc

5 al 11 de marzo2 al 8 de julio
Día 1237134
Día 2365308
Día 3

Día 4

Día 59991.966
Día 61.6222.090
Día 72.1282.347


Lo que no se explica claramente en la gráfica es si se está hablando de datos diarios o de datos acumulados. El texto de la noticia (que ha ido modificándose) da a entender que se trata de lo segundo:
El problema radica en que la curva actual es muy similar a la de principios de marzo. Concretamente a la semana del 5 al 11, poco antes de que se decretara el estado de alarma ante la implosión del Covid-19.
En esos siete días de marzo se pasó de 237 a 2.128 positivos y, según el informe de este jueves del Ministerio de Sanidad, en la última semana han dado positivo 2.491 personas.
Pero los números representados en la gráfica no corresponden con los que encontrarán ustedes en la única base de datos que mantiene activa en su web el ministerio, después de las complicadas idas y vueltas con este asunto de la difusión de datos (esa es otra discusión), que está en la web del Instituto Carlos III, y que tienen, para esas fechas, estos datos (solo hasta el 5 de julio porque se actualizan semanalmente):

Tabla 2. Casos detectados por PCR
FechaDiariosAcumuladosFechaDiariosAcumulados
05-mar.1.1681.16802-jul.8888
06-mar.1.4922.66003-jul.61149
07-mar.1.6384.29804-jul.48197
08-mar.1.9786.27605-jul.25222
09-mar.3.0849.360


10-mar.4.23613.596


11-mar.4.33417.930


Fuente: base datos RENAVE disponible en web del Instituto Carlos III

Según la tabla 2, entre el 5 y el 11 de marzo se acumularon casi 18.000 casos de coronarvirus, y 6.000 en los cuatro primeros días de ese periodo, mientras que entre el 2 y el 5 de julio sólo se habrían acumulado unos 200. Algunas personas, al ver estos datos y compararlos con los de la gráfica, han pensado que Abc estaba mintiendo o manipulando los datos y lo han comentado así en redes sociales. Pero no es eso lo que sucede. Es todo algo más sencillo, o más complicado, según como se mire, porque los datos de la tabla 1 y la tabla 2 miden cosas distintas.

Los datos de la tabla 2 son el resultado del famoso trabajo de "depuración" que el ministerio inició el 11 de mayo, y que tuvo paralizada durante un tiempo la publicación de datos, y están asignados a cada día por la fecha del comienzo de síntomas o, si no se tiene ese dato, a la fecha seis días anterior al diagnóstico. Los casi 18.000 casos de aquella semana de marzo son los que se calcula que tuvieron síntomas por primera vez en esos días, aunque la mayoría se diagnosticaran por PCR días después, y se notificaran al ministerio y aparecieran en las estadísticas todavía más tarde. Por otra parte, los datos de la tabla 2 para los días más recientes no son realmente comparables con los de marzo, porque por definición sabemos que entre los síntomas, el diagnóstico, y la notificación pasa un cierto tiempo. Por tanto, los datos de estos días recientes irán cambiando en próximas actualizaciones de la base de datos y solo tal vez dentro de dos o tres semanas podremos comparar, en igualdad de condiciones, los nuevos casos, por fecha de síntomas, de esta última semana, con los de marzo.


Los datos usados por Abc no proceden de esa base de datos, sino de los boletines publicados en pdf por el ministerio diariamente, aunque no han sido capaces de recoger datos exactamante comparables tampoco. Veamos. Para marzo sus datos sí corresponden con precisión con los que el gobierno estaba publicando en aquellos mismos días. Se pueden encontrar en los pdf con las actualizaciones diarias que el ministerio iba publicando, y que ya no son accesibles en su web (!!!), pero que los amigos de Datadista han guardado aquí (actualizaciones de la 37 a al 41; también entonces, como ahora, se dejaban de publicar los fines de semana). En esos primeros días no se distinguía por fecha de síntomas, de diagnóstico, o de notificación. Simplemente cada día se informaba del número de casos "nuevos", que se sumaban a los ya conocidos. Y así la cifra de casos "del día" coincidía exactamente con la diferencia entre los casos totales de ese día y la publicada la víspera.




Los datos de Abc para el mes de julio provienen también de las actualizaciones diarias, pero son un batiburrillo más diíficl de entender. Para los días en los que hay boletín están sumando cada día los "casos diagnosticados el día previo", pero los 1.966 casos acumulados hasta el quinto día (que sería el 6 de julio) no sé, francamente, de donde salen. En todo caso, los "casos diagnosticados el día previo" no son comparables con los datos que se publicaban en los boletines de marzo. Para hacer una comparación entre cosas iguales, habría que tomar, de los boletines de julio, la diferencia entre el número de casos totales conocidos cada día, y el del día anterior al primero de la serie, lo que recoge, como en marzo, simplemente el número de casos notificados acumulados, independientemente de su fecha de diagnóstico. El resultado sería este:

Tabla 3. Casos notificados acumulados

5 al 11 de marzo2 al 8 de julio
Día 1237444
Día 2365886
Día 3

Día 4

Día 59992.130
Día 61.6222.471
Día 72.1282.854
Fuente: elaboración propia con actualizaciones de datos publicadas por el Ministerio de Sanidad. Dados calculados por diferencia entre el número de casos totales conocidos en distintas fechas.

Pero entonces, tomando datos aparentemente iguales, resulta que Abc se estaba quedando corto: los datos son ahora aún peores que en la primera semana de marzo. Entonces se conocieron, en una semana, 2.100 casos y ahora son 2.800. ¡Encendamos todas las alarmas! En realidad no, porque...

 2. Esto viene pasando todas las semanas

Si comparamos los datos que Abc usa para esos primeros días de marzo, que miden la variación del número total de casos conocidos a lo largo de la semana, con datos similares de semanas posteriores resulta que prácticamente todas las semanas han sido iguales o peores que la que escoge Abc como referencia. Incluso cuando claramente la epidemia estaba frenando, como en mayo o junio. Veamos algunos ejemplos:


Tabla 4. Casos notificados acumulados

5 al 11 de marzo2 al 8 abril2 al 8 de mayo2 al 8 de junio2 al 8 de julio
Día 12377.292883294444
Día 236513.9771.337688886
Día 3
19.5282.3651.022
Día 4
23.2013.2361.340
Día 599928.4144.1301.6722.130
Día 61.62233.9935.2901.9122.471
Día 72.12839.7416.0782.0792.854
Fuente: elaboración propia con actualizaciones de datos publicadas por el Ministerio de Sanidad. Dados calculados por diferencia entre el número de casos totales conocidos en cada fecha.



Con la lógica de la noticia de ayer de Abc, en abril o mayo tendríamos que haber estado alarmadísimos, porque cualquiera de las semanas de esos meses eran mucho peores que la semana de primeros de marzo que ellos toman como referencia.


Pero en realidad esa comparación tiene poco o ningún sentido porque si ponemos el contador a cero cada semana, todas las semanas vamos a ver que se van acumulando casos. Y lo relevante no es si una semana se parece mucho o poco a la primera o la segunda semana de la epidemia, sino si se parece a la semana anterior. Porque evidentemente, si el número de casos semanales sube, y luego baja, en la fase descendente habrá semanas que se parecerán a la primera o a la segunda semana, en el número acumulado de casos durante la semana, pero eso no significa, obviamente, que a partir de entonces quepa esperar que pase lo mismo que pasó después de las primeras semanas.

Esto se ve claramente en la tabla. La semana del 2 al 8 de junio es muy parecida a la semana de marzo escogida por Abc. El artículo de ayer se podría haber publicado también el 9 de junio. Si esto fuera un anuncio de que se nos viene encima una repetición de la epidemia, ahora estaríamos como en los primeros días de abril, con 39.000 nuevos casos conocidos en una semana. En su lugar, tenemos 2.800.

No hay, por tanto, ningún motivo para pensar tampoco que lo que ha pasado esta semana, como "se parece" a lo de marzo (más o menos) anuncia que volvemos a las andadas y que en un mes estaremos como en abril. No es así.

Eso se ve simplemente con un gráfico que represente el número de casos nuevos notificados en periodos móviles de siete días, y que tiene este aspecto:


El número de casos notificados en periodos de siete días lleva más de un mes "pareciéndose" al de primeros de marzo. El artículo de ayer se podría haber publicado casi cada día desde hace un mes. Pero eso no anuncia nada particularmente grave. Simplemente estamos en la fase descendente, y los valores se han quedado más o menos estancados en valores similares a los que había en un cierto momento de la fase ascendente. Ninguna razón particular para la alarma.

En todo caso, lo que sí debería preocuparnos (con moderación) es que dentro de ese relativo estancamiento puede estar habiendo un cierto repunte, que se ve si hacemos zoom sobre las últimas semanas de ese gráfico:


A primeros de junio andábamos por los 2.000 nuevos casos conocidos en siete días, y ahora estamos casi en 3.000. Casi un 50% más, en un mes. Esto sí que sería motivo de cierta preocupación, aunque para complicar todo esto hay que añadir un elemento importantísimo que no he mencionado hasta ahora, y que hace que en realidad tampoco podamos decir que las cifras de esta semana se parecen a las de marzo.

3. Ahora hacemos muchos más tests que en marzo

La última complicación, claro, y lo primero en lo que yo pensé ayer cuando vi la famosa gráfica en Twitter, es que los datos de "nuevos casos conocidos" de marzo y julio no son realmente comparables, porque a primeros de marzo sólo se testaba a gente con síntomas muy severos, y ahora se está testando mucho más, a contactos asintomáticos de casos previamente conocidos. Y por eso los "casos confirmados" de hoy son un número con un significado muy distinto a los "casos  confirmados" de primeros de marzo. Por decir algo, a primeros de marzo se estaba diagnosticando tal vez a uno de cada quince casos existentes y ahora tal vez sea uno de cada 4 o uno de cada tres. Por lo tanto, 2.000 casos detectados en una semana en marzo equivaldrían realmente a unos 30.000 casos infectados, mientras que 2.000 casos detectados ahora equivaldrían tal vez a 6.000 u 8.000 infectados (siempre sabiendo que los detectados "hoy" se habrán infectado en torno a 10 días antes).
Solo tenemos datos publicados sobre el número de tests realizados desde finales de abril, pero aún así es suficiente para ver que los datos de casos confirmados no significan lo mismo ahora que en el mes de marzo. Un indicador de cómo ahora nuestra red de búsqueda de casos es mucho más potente la da el porcentaje de casos positivos detectados en relación al número de tests realizados, que ha evolucionado así:


Dicho de otra forma, hacia finales de abril hacíamos cuatro tests por cada caso positivo que encontrábamos, y ahora hacemos más de 60. A primeros de marzo la situación era mucho peor, aunque no tenemos datos precisos. Y por tanto, los 2.800 casos de siete días ahora no significan, de ninguna de las maneras, que la epidemia esté ahora en una situación ni remotamente similar a la de primeros de marzo, cuando los casos conocidos en una semana eran algunos menos.


En fin, esta iba a ser una nota rápida que se ha ido complicando. Espero no haberles cansado demasiado con tanto número y gráfica. Pero creo que la ocasión (desastrosa) lo merecía.

La noticia de Abc es un churro. Algo similar se podría haber publicado cada día, durante el último mes, y no significa, ni mucho menos, lo que Abc sugiere con su título. No estamos de ningún modo como a primeros de marzo, aunque sí estamos algo peor que a primeros de junio. Ahora está por ver si tenemos los nuevos casos suficientemente identificados y rastreados como para volver a la senda de descenso, o si continuamos con un suave crecimiento.

5 comentarios:

  1. Brillante análisis, gracias.

    ResponderEliminar
  2. Gracias, Josu, pero con lo de "la noticia de ABC es un churro" te has quedado corto. Tu analisis demuestra que con interés y sentido común se puede hacer un análisis serio. Entretanto, los "profesionales" no se molestan en el mínimo análisis crítico, especialmente si creen que han dado con un titular impactante. Absoluta irresponsabilidad generando alarmismo en un tema en el que deberían ser especialmente cuidadosos. El ABC debería publicar una retractación y pedir disculpas.

    ResponderEliminar
  3. Desde el 9 de junio hay in crecimiento exponencial, no tan grande como en marzo, pero exponecial

    ResponderEliminar
    Respuestas
    1. Quieren ocultarnos la gravedad de los brotes. Menos mal que en Extremadura se ha inaugurado una fábrica de mascarillas que dotará de ellas a los extremeños, que desde hoy están obligados a llevarlas. Así se evitarán los brotes. Extremadura, de hecho, quiere que sean obligatorias en toda España, poniendo graciosamente a disposición de los españoles la producción de la fábrica (a un precio muy conveniente). Y nosotros aquí poniendo paños calientes.

      Eliminar
    2. En USA hay crecimiento disparado (no sé si se puede calificar de exponencial) desde hace un mes. Y los muertos siguen igual.

      Eliminar

Gracias por participar. Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti, y tus comentarios no se confundan con los de otras personas.
Los comentarios de las entradas menos recientes son revisados por mí y no se publican inmediatamente.