30 de marzo de 2020

Incidencia y letalidad del COVID-19 por comunidades autónomas

Llevo días intrigado por las diferencias entre las comunidades autónomas españolas respecto a la letalidad (fallecidos/casos confirmados) del COVID-19. Estas gráficas que obtengo, de una serie de comunidades seleccionadas, ilustran que las diferencias son muy importantes:

Gráfico 1: CCAA con mayor letalidad hasta el 29/marzo. Elaboración propia con datos extraídos de Datadista

Gráfico 2: Algunas CCAA con letalidad baja hasta el 29/marzo. Elaboración propia con datos extraídos de Datadista

Buscando posibles factores explicativos, he hecho un ejercicio muy simple de comparación entre la letalidad (calculada siempre, recuerdo, sobre casos confirmados) y la incidencia del COVID-19 (faltan algunas CCAA a las que me referiré luego):

Gráfico 3: Letalidad e incidencia en CCAA seleccionadas, hasta el 29/marzo. Elaboración propia con datos extraídos de INE y Datadista

Con las cautelas precisas (correlación no siempre se deriva de causalidad; el número de casos es muy bajo; queda mucho para saber cuáles son los datos finales de la incidencia y la letalidad) la asociación entre las variables es llamativa. En particular, es notable la alineación casi perfecta entre los casos de las cuatro comunidades más pobladas (Andalucía, C. Valenciana, Cataluña y Madrid).

Por supuesto, soy consciente de la imprecisión de los datos, puesto que, como se ha comentado mucho estos días, no estamos seguros de que en todas partes se estén haciendo tests con los mismos criterios (lo que afectaría tanto a la incidencia, como al denominador de la tasa de letalidad), o de que esos criterios sean, en cada lugar, estables a lo largo de los días. También es posible que no se estén contando los fallecidos de la misma manera en todas partes (lo que afectaría al numerador de la tasa de letalidad). Sin embargo, parece poco probable que esas diferencias, que se han comentado mucho en relación con las comparaciones internacionales, sean demasiado grandes entre comunidades autónomas españolas, entre las que cabe imaginar, en principio, un grado considerable de similitud en el funcionamiento del sistema sanitario y de los procesos de recogida de información sobre fallecimientos. 

Por todo ello, creo que el gráfico 3 tiene al menos cierto interés, y ofrece una pista que hay que tener en cuenta a la hora de explicar las diferencias en la letalidad del COVID-19 entre comunidades. Una parte importante de la diferencia puede estar relacionada con el propio nivel alcanzado por la epidemia en cada comunidad, dado que a medida que la incidencia crece el sistema sanitario se resiente y va teniendo menos capacidad de respuestas. Podría ser también que una incidencia mayor quiera decir que hay un porcentaje mayor de los infectados que han tenido tiempo de pasar todo el proceso de la enfermedad, y eso por sí mismo diera lugar a una mayor tasa de letalidad. En todo caso, la relación parece mantenerse entre comunidades autónomas con diferentes niveles de riqueza, de gasto per cápita en sanidad pública, de color político de sus gobernantes y de modelos sanitarios diferentes en cuanto al peso de la sanidad pública y privada.   

El gráfico siguiente añade las tres comunidades que había omitido del anterior:

Gráfico 4: Letalidad e incidencia por CCAA, hasta el 29/marzo. Elaboración propia con datos extraídos de INE y Datadista

Las tres están claramente "desalineadas" respecto al resto.Sin buscar información adicional, me atrevo a lanzar la hipótesis de que los casos de País Vasco y Navarra sí tengan que ver, al menos en parte, con que sus sistemas públicos de salud tengan más recursos y estén sucediendo uno o dos de las siguientes cosas: a) se estén haciendo más tests (aumentando la incidencia aparente; y bajando la letalidad), b) haya más capacidad de atender a los casos más graves, reduciendo la letalidad.

El caso riojano es incluso más extremo. Es posible también que tenga algo que ver con mayores recursos de su sistema (es también una región relativamente rica). Pero teniendo en cuenta las noticias de primeros de marzo sobre un brote muy localizado en Haro, que habría afectado a muchas personas de las mismas familias en un barrio concreto, se me ocurre la hipótesis de que se haya hecho un control amplio a un grupo de personas con alta probabilidad de contagio, pero que fueran asintomáticas, y por ello la estructura de edades, y el nivel de riesgo, de los casos detectados en La Rioja sea diferente al de otras comunidades.

En fin, tanto el gráfico, como las hipótesis, son todavía extremadamente provisionales. Cuando todo esto pase, tal vez nada de lo dicho aquí tenga valor alguno. Tomen todo ello como lo que es: un intento de pensar en voz alta sobre lo que nos está pasando. Me conformo con que a algunos de ustedes les pueda servir para inspirar sus propias reflexiones o análisis.

11 comentarios:

  1. Creo que el último párrafo es el correcto. Incluso si de partida hay diferencias reales entre comunidades (más tests, mejor seguimiento, más recursos sanitarios), al cabo de un tiempo todo eso carece de importancia porque eso es lo que ocurre en una epidemia y la razón por la que son tan peligrosas.

    Es una enfermedad para la que no existe vacuna ni tratamiento por lo que la única forma de cortar la propagación es hacerlo desde el principio. Esto es verdad incluso para las epidemias para las que existe tratamiento, pero absolutamente imprescindible en las que no lo tienen. Lamentablemente hemos dejado pasar la oportunidad y ahora ya no se puede parar. Las medidas parciales de aislamiento social (las totales son imposibles) sólo afectan a la velocidad de propagación, no al resultado final, y tendría que ralentizarse muchísimo para que antes o después todos los sistemas sanitarios no se colapsen. De modo que da igual si el motivo por el que ahora mismo una comunidad tiene un comportamiento distinto porque todas se igualarán.

    ResponderEliminar
  2. Los datos que tenemos son basura y de la basura no se puede sacar nada.

    Me parece curiosa la actitud de muchas personas que parece que piensan que unos datos incorrectos son mejores que nada y hacen análisis detallados o publican tablas comparando los datos de todos los países. Presentar unos datos incorrectos sabiendo que lo son es mentir.

    Puedo entender el vértigo que produce estar en esta situación y no tener datos fiables de nada, pero es la situación en la que estamos y jugar con los datos falsos que tenemos no lo va a mejorar, más bien al revés.

    Por favor, que no se interprete esto como un ataque a esta web. Es una reflexión sobre lo que veo en todos los medios de comunicación del mundo. De hecho, lo publico aquí porque pienso que igual recibo alguna respuesta interesante, más allá del ataque al partido político que toque, que es lo único que recibiría en otros sitios.

    ResponderEliminar
    Respuestas
    1. Hola, ERG
      Yo enseño a mis alumnos lo de "garbage in, garbage out". Y sí, soy consciente de que estos datos son imperfectos.

      Pero siendo conscientes de ello, entiendo tu argumento excesivo.

      No creo que hacer tablas o gráficos con datos incompletos u heterogéneos sea igual a mentir, sobre todo si esos datos son los únicos disponibles, y al presentarlos se explican las carencias.

      Tomado tu texto literalmente, no deberíamos ni mirar estos datos, puesto que haciendo cualquier cosa con ellos estaríamos peor que no haciéndolo.

      Si no podemos "jugar" con los datos "falsos" que tenemos, ¿qué propones como alternativa?

      Eliminar
  3. Pues no hacerlo, evidentemente. Aceptar la realidad, que es que no tenemos datos fiables.

    Explicar las carencias no soluciona el problema. Es como mentir y al mismo tiempo avisar de que se está mintiendo. No se gana nada, porque lo que se está diciendo no deja de ser falso, y tiene el inconveniente obvio de que en cuanto alguien lo transmite se pierde el aviso y a mucha gente le llega sin él. Es como darle una pistola cargada a un niño de cinco años. Luego puedes decir que no has disparado tú pero...

    Y podríamos entrar en el tema de los datos falseados deliberadamente, que se está ayudando a difundir (no digo que sea el caso, es un supuesto, pero con todos los datos que se están dando en todo el mundo y el caos que hay...).

    Pero lo que más me sorprende de todo es el argumento de que son los únicos disponibles. ¿Bajo qué razonamiento eso es un argumento a favor? No lo puedo entender. Es como si un periodista publica una noticia falsa o sin contrastar, porque era la única que había ese día.

    ResponderEliminar
    Respuestas
    1. Tu respuesta entonces es que, por ejemplo, cuando dentro de una semana el gobierno tenga que volver a decidir si pide al Congreso prolongar el estado de alarma, o si vuelve a permitir que trabajen personas en actividades no esenciales a partir del 13 de abril, o si toma decisiones distintas en diferentes territorios, no debe mirar ningún número, puesto que estos no valen para nada. ¿Qué tiene que usar, entonces? ¿El horóscopo? ¿Las entrañas de un ganso?

      Tampoco los ciudadanos podemos usar ningún número para tratar de entender lo que hacen los gobiernos, y formarnos una opinión. Porque ningún número vale para nada. Es decir, aplaudamos o abucheemos al gobierno (de España, en este caso), siguiendo cualquier otro criterio, como lo guapo que es Sánchez o lo poco que nos gusta la coleta de Iglesias, pero no los números que tenemos, porque sabemos que no sirven para nada. Mirar los números, has dicho, y repites, ¡es peor que no hacerlo!

      En realidad, todos los datos sociales y económicos con los que trabajamos (y también los de muchas disciplinas científicas) sabemos que son imprecisos, y que tienen importantes márgenes de error, y por tanto, considerable incertidumbre. Eso se aplica al PIB, al paro, a la inflación, y hasta a los censos de población. Si tuviéramos que esperar siempre a estar absolutamente seguros de la exactitud y certidumbre de los datos, estaríamos prácticamente paralizados constantemente. Y en una situación como la actual, simplemente, no podríamos hacer nada, ni decir nada.

      Si te entiendo bien, no tengo por qué pensar que hay una epidemia ahora mismo en España, ni tengo ningún motivo para saber, suponiendo que exista, que su incidencia sea mayor en una comunidad que en otra. Puede que haya una epidemia, o puede que no. Puede que sea más intensa en Madrid y menos en Andalucía. O puede que sea al revés. Puede que haya sido buena idea el confinamiento o no, no hay forma de saberlo. Tampoco hay ninguna forma de saber si debemos prolongarlo una semana, un mes o dos, porque, literalmente, no sabemos nada de lo que está pasando.

      Obviamente, no puedo compartir esa perspectiva.

      Eliminar
    2. Estarse quietos es muy agobiante. Hay que hacer algo, aunque no sepamos por qué.

      Eliminar
    3. Los datos que tenemos son entrañas de ganso. Es una superstición que sirve para que personas ingenuas crean que se sabe lo que está pasando y lo que va a pasar. Pero es sólo eso, una superstición.

      Ahora mismo el número oficial de casos en España es de unos cien mil, expertos de la OMS dicen que el número real puede ser diez veces mayor y el Imperial College estima que pueden ser hasta siete millones. ¿Qué dato debe usar el gobierno para sus decisiones? Es mejor que usen el horóscopo.

      Está claro que los datos perfectos no existen pero eso no significa que haya que aceptar cualquier cosa. Hay datos que son lo suficientemente buenos y permiten sacar conclusiones válidas y hay datos que no lo son. ¿Si los datos se hubiesen generado aleatoriamente también habría que usarlos por ser los únicos? ¿Estamos de acuerdo al menos en que hay un límite teórico de calidad por debajo del cual los datos no deben usarse?

      Hay datos fiables para saber que hay una epidemia, pero las otras cosas que dices, no está tan claro. Por ejemplo, la efectividad del confinamiento. Se supone que es positivo por una cuestión de sentido común, pero nadie puede cuantificarlo. Es imposible calcular el efecto que ha tenido el confinamiento en la tasa de contagios porque no se sabe ni el número real de casos ni el período de incubación. El gobierno tendrá que tomar una decisión sobre el confinamiento sin tener la más mínima idea sobre el efecto que ha tenido. Eso es un hecho.

      Al final, por lo que veo, se trata de conservar la ilusión de que estamos en un mundo civilizado en el que las decisiones se basan en el conocimiento. Pero lamentablemente, es una ilusión. No tenemos el conocimiento necesario, ahora mismo.

      Por si hubiera alguna duda, yo no quiero el oscurantismo, sólo lo constato.

      Eliminar
    4. Estaba escribiendo una respuesta, pero me repetiría.

      Sí, claro, hay un umbral mínimo de calidad por debajo del cual podemos tirar los datos a la basura.

      En mi opinión, claramente, los datos actuales superan ese umbral. No son iguales a datos aleatorios. No son tripas de ganso.

      Son, dadas las circunstancias, mucho mejor que nada.

      Eliminar
    5. Me alegro de que coincidamos en algo, al menos.

      Parece que al final el desacuerdo es en cómo de malos son los datos.

      Yo creo que podemos dar por terminada la discusión. Un placer. Gracias.

      Eliminar
  4. En mi opinion... si admitimos que los datos (me refiero a los de "casos confirmados") son inexactos pero "honrados" (quiero decir... las autoridades NO PUEDEN saber el numero de infectados... solo el de casos graves que llegan al hospital. Pero no es que lo manipulen queriendo, es que nos dan lo poco que tienen) es dato sirve de poco para saber el número de infectados... pero si entendemos que todos los días se toman poco más o menos según los mismos criterios (casos graves) su tendencia si que nos vale de orientacion de si los casos diarios (bueno, los de hace 15 días) suben rapido, suben lento, mas o menos se mantienen o empiezan a bajar.
    Eso si, en cuanto se cambie el critero (han llegado tests rápidos a mansalva... haremos la prueba a todo el que pillemos por la calle) cambia totalmente... y las tendencias servirá desde ese punto hacia adelante. De el número de fallecidos... algo similar puedo decir (sabiendo que mide los infectado aprox de hace más tiempo... ¿unos 30 dias?)

    Vamos, que los datos que tenemos (siempre que no consideremos que están directamente falseados) son mucho mejores que nada.

    ResponderEliminar
  5. Por lo que se lee en los medios de comunicación, los protocolos ya han cambiado varias veces según los casos han ido aumentando y los medios disminuyendo. Y por supuesto, todo se ha mezclado en los mismos datos. Hasta donde yo sé, no hay un sitio oficial donde se especifiquen los protocolos que se siguen (a quién se hace las pruebas, a quién no, qué fallecimientos se cuentan, cuáles no). Y tampoco hay seguridad de que se estén usando los mismos en todas las comunidades. Aparte, yo estaba hablando de los datos de todos los países, con lo que estos problemas, lógicamente, se agravan.

    Yo creo que se puede asegurar que:

    - Los números de casos y de fallecimientos no coinciden con los números de casos y fallecimientos reales, y pueden diferenciarse en órdenes de magnitud.

    - Los mismos datos no son comparables entre diferentes países (ni posiblemente entre comunidades).

    - Los mismos datos no son comparables entre franjas de tiempo distintas (por lo que digo arriba).

    Como no sea para engañar a alguien, no sé para qué pueden servir.

    ResponderEliminar

Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti. Gracias.