15 de agosto de 2011

Un error obvio, y otro no tanto

Me manda un lector esta frase, extraída de una noticia publicada por El País en su sección Pantallas, el sábado 13, sobre la rivalidad entre Google+ y Facebook:
Aunque la mayoría de juegos son gratuitos, para obtener complementos y equipaje, el jugador debe comprarlos. Ahí está el negocio. En Estados Unidos, se calcula que los jugadores se gastarán este año 653 millones de dólares (458.740 euros) en bienes digitales.
Como observa el lector, la conversión de las monedas de dólares a euros se ha realizado con un error "simple, pero garrafal", de olvidarse tres ceros, o dividir por mil, el valor en euros del gasto en juegos online en Estados Unidos, que no sería, por supuesto, de 458.740 euros, sino de 458,74 millones de euros. Es el típico error que se deriva de nuestra dificultad para tratar con números grandes, que hacen referencia a cosas que no son de la vida cotidiana (si la notica hablase, por ejemplo, de que un aparato cuesta 6.530 dólares, nunca se habrían convertido en 4,587 euros al cambio).

¿Se habría arreglado el problema, entonces, si el periodista hubiera escrito 458,74 millones de euros? No, porque hay otro error más sutil que tiene que ver con la falsa precisión en la que incurren algunos cuando, partiendo de una cifra original redondeada, o estimada, la convierten en otra cifra (en otra unidad de medida, en una tasa per cápita, en otra moneda) y ponen el resultado de la operación con muchos números significativos, tratando de ser muy precisos en lo que es imprecisable.

Así, como he leído alguna vez [actualización: como bien me recuerda Toño, lo leí en La Blogo], si usted ve en un texto periodístico, de novela, o de ensayo (no científico), traducido del inglés, que se habla de una distancia de 4,8 kilómetros, lo que probablemente ha sucedido es que el traductor ha convertido el texto original, que decía "tres millas", multiplicando correctamente por el factor de conversión, pero olvidando que el dato original no era, con toda probabilidad, preciso, sino aproximado, y que por tanto, lo lógico sería traducir "tres millas" por "cinco kilómetros", respetando el mismo nivel aproximado de precisión del texto original.

En el caso de la conversión de monedas, como el de la noticia que nos ocupa, pasa lo mismo, con el agravante de que los tipos de cambio son variables de día en día, de manera que lo que es hoy superpreciso, mañana deja de serlo. Mientras que una milla son siempre 1,60934 km, 1 dólar va cambiando de valor según el día y la hora. El sábado el periodista, antes de chafarla, calculó que 653 millones de dólares eran 458,74 millones de euros, pero ahora Google (escribiendo en el buscador "653 million dollar in euros") me dice que son 455,94 millones y según el último cambio de Yahoo Finanzas, serían 457,49 millones. En cuestión de horas la conversión puede variar en varios millones de euros.

Si a eso sumamos que la cifra original en dólares es una aproximación, una estimación, por lo tanto redondeada, el absurdo de la falsa precisión de los decimales se multiplica. Los 653 millones de dólares son aproximados. Por tanto, la conversión no puede ser más precisa que el original. Basta con decir 459 millones (el sábado), 456 millones (hoy, Google), o 458 millones (hoy, Yahoo Finanzas). Poner más decimales, en este caso, no mejora la información. Sólo añade ruido e impresión de precisión a algo que es por naturaleza impreciso.

20 comentarios:

  1. Te la coges con papel de fumar.
    Por cierto, "lo lógico sería traducir "tres millas" por "cinco kilómetros", respetando el mismo nivel aproximado de precisión del texto original."...
    Te has lucido, majete y has clavado el mismo nivel aproximado de precisión

    ResponderEliminar
  2. Aparte de que esto me parece hilar demasiado fino (personalmente, jamás consideraría malaprensa una conversión bien hecha, aunque ésta sea variable y sobre un valor aproximado), aparte de eso, digo, ¿te das cuenta Josu que casi todo el post está dedicado a un "error" que el periodista no ha cometido (porque ha cometido otro)?

    Un saludo. mg

    ResponderEliminar
  3. Mg
    El error parte de creer que "653 millones", cifra aproximada, y redondeada, es 653.000.000, cifra precisa y exacta.
    No es una buena conversión porque malinterpreta el dato original.

    ResponderEliminar
  4. Es un error que no me extraña que ocurra, y mucho. Tampoco me extraña que te lo discutan.

    La mayoría de la gente que haya estudiado alguna disciplina de matemáticas o ciencias debería haber tenido que tratar con diferentes precisiones y controlar la magnitud del error de un cálculo y por tanto aprender que 4 no quiere decir lo mismo que 4,000. Pero entre que muchos no tienen esa formación, y los que la tienen muchas veces parece que ignoran este tipo de cuestiones, mal vamos...

    En una carrera de ingeniería he visto como profesores insistían en que se pusiera en la respuesta a ejercicios de examen todos los decimales que salían en la calculadora a preguntas con precisión de uno o dos decimales para «tener la máxima presición».

    ResponderEliminar
  5. Otra metedura frecuente es la de traducir del inglés americano billones o trillones como es en el resto del mundo (un billón americano es mil millones y no un millón de millones como es en en otras partes, etc.).
    De todas formas, lo de las cifras en artículos yo creo que hay tomarlo siempre con cierta cautela, porque aunque haya que dar esas cifras, cuando las cantidades son tan grandes, realmente es difícil de digerir o imaginar y no creo que aporte mucho a la información....
    J.Wetback

    ResponderEliminar
  6. En el caso de la traducción de novelas, traducir 3 millas por 5 kilómetros seria lo correcto, está bastante claro que el autor no pretende dar una cifra precisa.
    En un texto periodístico habría que indicar que el dato tiene un cierto grado de imprecisión, y una manera es quitando decimales, otra sería usando por ejemplo "cerca de XXX Millones".

    Cuando presentamos un resultado final es comprensible eliminar algunos decimales. Pero después de leer el artículo parece que se esté justificado eliminar decimales como algo que debiera hacerse siempre que haya imprecisión.
    653 millones y 653.000.000 son el mismo numero. En ninguno de los dos casos se especifica el error.
    Parece que estamos justificando añadir una imprecisión (quitar decimales en un sitio) por "presuponer" otra imprecisión ¿¿mayor?? en otro sitio. ¿Y si el dato de base era más preciso de lo que uno se pensaba? ¿Se ha calculado el error?
    El resultado de quitar decimales de esta manera es eliminar información gratuitamente. Quitar decimales porque sí, sin saber el número de cifras significativas es manipular los datos. Calcular el error no es para nada algo trivial. Así que si no sabemos o no podemos calcular el error lo mejor es no inventárselo.
    Esto es especialmente importante cuando estamos haciendo varios cálculos seguidos. Si a cada paso quitamos algunos decimales porque nos "parece" que son poco importantes, el resultado final puede ser cualquier cosa.

    ResponderEliminar
  7. Anónimo, si el dato de partida es una estimación, y es un número redondo, no hay que darle muchas vueltas. Seguro que se ha redondeado. Si luego además vas a aplicar un tipo de cambio que varía cada hora... poner una cifra con más precisión que la original (descender a las fracciones del millón) es completamente absurdo y falsamente impreciso.

    ResponderEliminar
  8. Josu, o lo explicas tres veces o no lo captan. Yo no tengo estudios y lo entendí a la primera.

    ResponderEliminar
  9. Figúrate: si lo has explicado tan bien y hay gente que sigue sin entenderlo, qué puedes esperar de un periodista al que jamás se lo han explicado.
    Aunque conste que, si por mí fuera, agregaría al plan de estudios de la carrera de periodismo la materia "Tratamiento de cifras y estadísticas", con muchos ejercicios prácticos.

    ResponderEliminar
  10. Para los que dicen que no hay que quitar decimales, mi profesor de física en el instituto se encargaba de reducir la nota de los estudiantes que, aún poniendo el resultado "correcto", ponían más decimales de los correspondientes en la solución.
    Igualmente nos machacaba nuestro profesor de métodos numéricos en la carrera con el error de poner todos los decimales usados en los cálculos intermedios en la solución final. Es más, casi cualquier profesor se encargaba, a cada momento, de recordarte que trataras los datos como una "sugerencia" alrededor del cual flota el valor real, y que las conclusiones estuvieran en consonancia con la imprecación y variabilidad de los datos.

    Al poner más precisión de la que hay, se hace que el lector no piense en la variabilidad del valor real del dato y eso está MAL; ergo, hay que penalizarlo. Además, en ocasiones los periodistas directamente dan cantidades en euros, sin indicar la cantidad original. Lo correcto es decir: "...unos X millones de dólares, alrededor de Y millones de euros al cambio actual..." o similar, sin querer ser más precisos de lo que realmente se puede ser.

    Por supuesto, siempre teniendo cuidado de traducir bien los números de escala corta (billón = mil millones, lo que decimos millardo) a escala larga (billón = millón de millones) y de expresar los decimales correctamente (en inglés mediante el punto y en español mediante la coma).

    ResponderEliminar
  11. Anonimo de las 00:18, cuando se tratan datos númericos 1,00 no es lo mismo que 1, cuando pones lo primero estás indicando que el resultado es correcto hasta el segundo decimal, incluido el redondeo correspondiente, y cuando pones 1 estás indicando que no puedes poner más decimales por que no serían correctos.
    Así que como puedes ver no es lo mismo, si dispones de mayor precisión la pones, si no, no.

    ResponderEliminar
  12. Esta vez estoy de acuerdo con Malaprensa. Igual que lo de las iniciales de la chica era sacar las cosas de quicio, en este caso escribir más cifras de las necesarias aturulla al lector. Al lector hay que meterle pocos datos, pero importantes. Y cifras significativas, las menos posibles. Los lectores normales (no los frikis que leen Malaprensa y que llenarían los periódicos de números) no están con el Excel tomando nota, como para encima meterle datos innecesarios.

    ResponderEliminar
  13. Anónimo 00:18, pensar que el cálculo de lo que se van a gastar este año los jugadores estadounidenses en bienes digitales puede ser algo mínimamente preciso es confiar demasiado en las dotes estimatorias del ser humano. Es evidente que es una estimación gruesa, probablemente extrapolada de otra que ya de por sí sería imprecisa (por ejemplo, ventas del año anterior, cifra que se puede estimar pero no conocer con precisión, no todas las ventas están controladas). Liarse a dar cifras significativas en una situación así es completamente absurdo.

    ResponderEliminar
  14. A mí me recuerda a este tipo de noticias que dicen "El tabaco mata cada año a 52.321 personas"

    ResponderEliminar
  15. Anónimo de las 00:1817 de agosto de 2011, 21:38

    Cuando una persona escribe "el resultado es XX.YY y no tengo ni idea del error", esta persona está siendo sincera y objetiva.
    Cuando vemos "el resultado es YY", hay subjetividad. La persona está indicando un valor y también lo impreciso cree que es (por el número de decimales borrados). Y como nadie calcula errores hay subjetividad en lo que a uno le parece que "probablemente" será el error. En muchos casos acertará, en algunos se equivocará.
    Por supuesto que me parece correcto no dar a entender a un lector que una cifra es más precisa de lo que realmente es. Y como dije anteriormente hay varias maneras de indicarlo no sólo eliminado decimales.

    En el ejemplo concreto de la noticia admito que está justificado eliminar todos decimales del resultado a ojo, debido a la variabilidad del tipo de cambio. Aunque no sabemos si el dato de base eran 653 millones o 653,0 millones y simplemente el periodista no usa la convención de escribir el ,0 como cifra significativa.
    Mi comentario anterior era por la referencia al hecho de que no eliminar decimales se considera error sutil en datos estimados. Que sea un dato estimado no significa necesariamente que sea impreciso. Hay datos que se pueden estimar con una gran precisión. En otros datos, es prácticamente imposible estimar el error. Borrar decimales sería incorrecto en el primer caso y arbitrario en el segundo.
    Si un estudio da XX.YY como estimador y se desconoce el error (o varianza del estimador)... pues esto es lo que hay. El resultado es este XX.YY y no otro. Y es habitual desconocer el error.
    Redondear a ojo, sin conocer el error, funcionará suficientemente bien en campos conocidos pero aplicarlo de manera generalizada puede ser arriesgado, y arbitrario. Añadir cocinados a los datos es algo que para mi debería hacerse lo mínimo posible.

    También es verdad que en muchos estudios se usan métodos muy burdos y asumir que el error será enorme es una buena práctica.

    ResponderEliminar
  16. Anónimo
    PUes veo que en lo fundamental estamos de acuerdo.
    Creo que parte del debate está en la palabra "estimación", que se usa con significados que creo que son diferentes. Puede ser tanto el resultado de un proceso de cálculo matemático y muy preciso, pero del que se supone o sabe que tiene un margen de error (imagina: estimación de resistencia de una estructura); o también estimación puede ser algo la especulación informada de alguien que sabe del tema, tiene información sobre trayectorias, tendencias, ...
    La de la noticia es más bien del segundo tipo y por eso creo que la presunción de que no hay más precisión debajo es casi seguramente cierta.

    ResponderEliminar
  17. Anonimo de las 00:18:
    Decir "el resultado es XX.YY y no tengo ni idea del error", es tanto como no decir nada.
    Ejemplo: Pi es 9,154684 y no tengo ni idea del error.
    Un dato númerico sin una estimación del error no sirve absolutamente para nada, por mucho que el dato sea una estimación.

    ResponderEliminar
  18. En efecto, Toño
    Ahí fue sin duda donde lo leí, pero no lo recordaba.
    He puesto un enlace en el texto.
    Un saludo

    ResponderEliminar

Gracias por participar. Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti, y tus comentarios no se confundan con los de otras personas.
Los comentarios de las entradas menos recientes son revisados por mí y no se publican inmediatamente.