25 de abril de 2014

Espejismos estadísticos: el tráfico en las autopistas

Como anunciaba en mi entrada anterior, ayer hablé en El Purgatorio de Onda Cero de las noticias sobre el tráfico en las autopistas de peaje, que según noticias divulgadas en muchos medios, habría sido en el primer trimestre de este año el más bajo desde 1996.

Estas noticias son erróneas por que caen en dos "espejismos estadísticos", término que propongo usar para datos estadísticos que son absolutamente correctos en su cálculo, que no tienen errores metodológicos, ni definiciones problemáticas, que están elaborados siguiendo protocolos intachables, y que sin embargo producen impresiones erróneas.

Por ejemplo, a primeros de 2013, El Confidencial usaba el término en su titular, en este sentido, para referirse al aumento de la compraventa de viviendas que había aparecido en enero y febrero de aquel año en las estadísticas del INE, respecto a los mismos meses de 2012. El truco estaba en que el año 2012 fue el último en el que la compra de una vivienda daba derecho a una desgravación fiscal. Por eso, la gente que estaba pensando en comprar un piso en un plazo breve intentó hacerlo antes de que acabara el año. Y así, a finales de año hubo un aumento importante de ventas, que simplemente adelantó las que se hubieran producido unos meses más tarde. Pero la estadística del INE se basa en los datos de lo registradores de la propiedad, que van con uno o dos meses de retraso respecto al momento de la escritura ante notario. Por eso, el aumento de ventas de finales de 2012 aparece en la estadística del INE a comienzos de 2013.

En todo caso, son movimientos artificiales, causados por el cambio en la legislación fiscal, que no nos dicen nada sobre cómo va el fenómeno de fondo. Y son movimientos cuyo eco aún se siente: este años los meses de enero y febrero han sido aparentemente muy malos, mucho peores que los precedentes, con caídas superiores al 20% en las ventas respecto a los mismos meses del año anterior... que como hemos visto estaban anormalmente hinchadas por la gente que se había apresurado a escriturar su compra, a finales de 2012, para tener desgravación fiscal.

Pero volvamos a los datos de las autopistas. ¿Por qué digo que son un espejismo estadístico? Hay dos razones combinadas, en este caso.

El primer espejismo es el más específico, y el más que me parece más obvio, y está causado por la movilidad de la Semana Santa. Como la Semana Santa algunos años cae en marzo y otros en abril, TODAS las comparaciones en temas económicos, de consumo, laborales, entre años en los que la Semana Santa cae en meses distintos se ven alteradas. En la mayoría de las estadísticas, el mes en el que cae la Semana Santa es "peor" que el mes similar sin ella, porque al haber menos días laborables se produce menos o se vende menos. Pero en algunas actividades económicas, vinculadas al ocio y el turismo, el mes con Semana Santa es "mejor" que el mes equivalente sin ella. Pensemos en las pernoctaciones hoteleras, el consumo de bares y restaurantes, los viajeros en transporte público de larga distancia... o las autopistas de peaje.

Y esto es justamente lo que pasa al comparar el primer trimestre de este año con los años anteriores y decir que es "el peor desde 1996": se está incluyendo en la comparación primeros trimestres con y sin Semana Santa. Y concretamente, se está diciendo (implícitamente) que el primer trimestre de este año ha sido peor que el del año pasado, sin tener en cuenta que el año pasado la Semana Santa cayó en marzo, y este año ha caído en abril.

Y así, resulta que las propias noticias que daban este dato alarmante comentaban que era curioso que el trimestre de enero a marzo de este año fuera peor que el del año pasado, a pesar de que en enero y febrero el tráfico había subido en comparación con 2013. Es decir, que toda la bajada del trimestre se debe a la caída de marzo. Es más, si vamos a la web del ministerio de Fomento (xls) podemos ver que ya en noviembre y diciembre los tráficos en autopista habían subido respecto al año anterior. La caída de marzo, que arrastra al trimestre entero, es solo, por tanto, un espejismo. Me atrevo a asegurar que cuando tengamos los datos de enero a abril (el famoso “en lo que va de año”) y los comparemos con los del año pasado veremos claramente que el tráfico en las autopistas está aumentando y que el peor periodo de enero a abril desde 1996 habrá sido el de 2013, no el de 2014.

Hay otro problema adicional, menos obvio, pero que también es una dificultad a tener en cuenta cuando comparamos a lo largo del tiempo cualquier estadística. Es el problema de la heterogeneidad, es decir, de los cambios en la composición del grupo que estamos estudiando. En este caso, estamos comparando el tráfico en las autopistas españolas en 2014 con las de 1996. Pero no son las mismas autopistas.

Volviendo a la web del ministerio, tenemos en ella los datos de tráfico, mes a mes, desde 1990, de todas las actuales autopistas estatales de peaje (no se incluyen, por tanto, las autopistas autonómicas de peaje, aunque algunas de ellas sí eran autopistas estatales en los años noventa). Las que ya existían en 1996 eran ocho.  Son las ahora denominadas AP-1, de Burgos a Armiñón; AP-2,  de Zaragoza al Mediterráneo; AP-4, Sevilla-Cádiz; AP-6, Villaba-Adanero; los tramos de la AP-7, de La Junquera a Alicante; AP-9, Ferrol-Portugal (no estaba completa aún en 1996); AP-66, León- Campomanes; y AP-68 Bilbao-Zaragoza.

Sumando sus kilometrajes en 1996 se obtienen 1.628 kilómetros, aunque la estadística agregada del ministerio dice que había entonces 1.733,7 kilómetros. Tal vez se esté incluyendo en aquel dato alguna de las autopistas que luego se transfirió a las comunidades autónomas.

Desde 1996 se han ampliado algunas de las autopistas existentes y se han inaugurado varias otras, añadiendo 932 kilómetros al dato de 1996 (825 según la suma del ministerio, que como he dicho en 1996 cuenta 105 kilómetros más de los que me salen a mí).

Los ampliaciones son fundamentalmente en la AP-9 Ferrol-Portugal (que ha añadido 62 kilómetros), y en la AP-7, con la circunvalación de Alicante, y los tramos Alicante-Cartagena, Cartagena-Vera, y Málaga-Guadiaro. Las nuevas autopistas son, por orden de apertura, la AP-51, Ávila-Villacastín; la AP-71, León-Astorga; AP-53, Santiago de Compostela-Alto de Santo Domingo; AP-61, Segovia-San Rafael; las radiales de Madrid, alternativas a las autovías nacionales (R-2, R-3, R-4, R-5); la M-12, eje Aeropuerto de Madrid; AP-36, Ocaña-La Roda; AP-41, Madrid-Toledo; AP-46, Alto de las Pedrizas-Málaga.

Muchas de estas nuevas autopistas son famosas, precisamente, y desgraciadamente, porque tienen un tráfico bajísimo, han resultado ruinosas, y nos vamos a gastar mucho dinero en rescatarlas. Al presentar juntos los datos de tráfico de todas las autopistas, las viejas y las nuevas, y compararlos con los de 1996, estamos mezclando dos conjuntos que en este caso sabemos que son muy heterogéneos. En jerga de estadística diríamos que son dos poblaciones que es mejor analizar por separado.

A partir de los datos del ministerio de cada una de las autopistas es posible comparar la evolución del tráfico en las "viejas" (las que ya existían en 1996) y las "nuevas" (las inauguradas después), con la excepción de los nuevos tramos de la AP-9, que no se pueden analizar por separado, e incluiré junto a los "viejos". Los datos individuales de cada autopista (o tramo con concesión separada) solo están en la web del Ministerio hasta enero de este año. Así que la comparación hasta marzo no es posible, pero se puede hacer una aproximación con los datos anuales, porque además, como ya he comentado, a finales del año pasado empezaron a mejorar, de manera que podemos dar por hecho que 2013 será en conjunto peor que 2014.

El resultado es que el tráfico medio en 2013 en las autopistas “viejas” fue todavía un 36% superior al tráfico de 1996, con una intensidad media diaria de 20.000 vehículos al día, frente a 14.700 en 1996. Es de todos modos un dato que está un 30% por debajo del máximo, que se alcanzó en 2007, y es el peor desde 1999.

En las autopistas nuevas, por definición, no podemos comparar su tráfico con el de 1996, pero sí podemos compararlas con las viejas: su tráfico medio en 2013 fue de solo 8.000 vehículos al día, frente a las 20.000 de las viejas. Es incluso poco más de la mitad del tráfico que las autopistas “viejas” tenían ya en 1996. Si las incluimos en la media de 2013 y las comparamos con los datos de 1996, tiran de la media hacia abajo, pero en realidad estamos comparando cosas incomparables. En este gráfico, que ya publiqué ayer, podemos ver la evolución del tráfico en las autopistas viejas y nuevas, desde 1990:




Puede verse cómo la mezcla de los dos conjuntos heterogéneos produjo ya resultados extraños desde primeros de los años 2000. A pesar de estar en época de gran crecimiento económico la estadística global muestra un tráfico aparentemente estancado entre 2001 y 2007. En realidad lo que pasaba es que el tráfico seguía creciendo, a buen ritmo, tanto en las autopistas viejas como en las nuevas, pero las que se iban abriendo tenían menos tráfico que las anteriores, haciendo que la media de las nuevas bajase, y la media total se mantuviera estable.

A partir de 2008, en cambio, el tráfico sí empieza a bajar en todas las autopistas. Tanto las viejas como las nuevas pierden aproximadamente un 30% del tráfico máximo, alcanzado en 2007. Con ello, las viejas caen en 2013 hasta un nivel intermedio entre el de 1999 y 2000. Las nuevas, que terminaron de inaugurarse precisamente en 2007 (excepto los 28 km de la AP-46, que se añadieron en 2011) bajan al mismo ritmo, y se mantienen desde aquel año en un tráfico que es solo el 40% de la media de las viejas.

Estamos ante un ejemplo de la falacia de composición, el error que se produce al comparar la evolución de datos de un grupo que experimenta un importante cambio interno en el periodo estudiado, que afecta al tema estudiado. Xavier Sala-i-Martin lo explica aquí aplicado a los sueldos.

Por poner otro ejemplo, es como si alguien comparara la renta per cápita en la República Federal de Alemania en 1985 y en 1995, y observara un gran descenso, sin tener en cuenta que por medio esa entidad a la que llamábamos RFA, de 60 millones de habitantes, había absorbido a los 16 millones de habitantes de la RDA, mucho más pobres. Sí, la entidad de la que hablamos se sigue llamando RFA, pero no es realmente la misma cosa, y por tanto, no podemos extraer conclusiones de comparar los datos de la Alemania unificada con los de la antigua Alemania occidental.

En nuestro caso, "la cosa" a la que llamamos "autopistas estatales de peaje" ha cambiado enormemente al añadirle un montón de autopistas mal pensadas, de muy bajo tráfico. La comparación entre el tráfico de hoy y el de 1996 está irremediablemente viciada por ese cambio de composición. Puede que esté correctamente calculada, pero es un espejismo.

5 comentarios:

  1. Hombre, lo realmente interesante es saber en qué medida ha variado el tráfico por las autopistas de peaje en relación con el aumento del parque móvil entre 1996 y 2013.

    ResponderEliminar
  2. Súbete a mi buga,
    Yo no diría que es "lo realmente interesante", sino más bien "otro asunto interesante".
    Más que con el parque móvil, además, la relación interesante sería con el total del tráfico, porque los coches pueden circular más o menos.
    Esa es otra cuenta, que en efecto puede hacerse.

    ResponderEliminar
  3. En esa segunda cuenta que mencionas, ademas, se podria ver el posible efecto de las vias de tren de alta velocidad en el posible descenso del trafico en algunas de estas autopistas, que seguro que ha habido. Yo a Pamplona ya no viajo en coche nunca, el tren es mas rapido y comodo, no hay color. Por poner un ejemplo solo.

    ResponderEliminar
  4. elpep,
    Ese sería un paso adicional, el de preguntarse los porqués. Aquí estamos en una fase previa: antes de buscar la explicación, hay que preguntarse si uno tiene bien medido el fenómeno.

    ResponderEliminar
  5. Fantástico artículo Josu.

    ResponderEliminar

Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti. Gracias.