10 de febrero de 2011

¿Somos los segundos en pornografía infantil?

Habrán visto estos días el despliegue en todos los medios. Para una cosa en la que somos los segundos del mundo, resulta que es en la posesión y/o descarga de pornografía infantil (por ejemplo: Elpais.com, Abc.es, Lavanguardia.es, y otros muchos). También ha llegado al papel al menos en Abc y El País. E imagino que radios y televisiones se habrán unido al coro.

La cosa, según parece, es muy grave, porque somos el número 2 del mundo, no en tasa, sino en valores absolutos, es decir, que el número total de archivos de este tipo identificados en ordenadores en España es el segundo más alto del mundo, después de Estados Unidos. Concretamente, cada día se encontraron el año pasado como media 1.172 archivos en Estados Unidos y 645 en España. Pero como bien saben los lectores de esta página, las comparaciones en valores absolutos son inútiles. Deberíamos hacer una tasa por millón de habitantes. Redondeando somos 46 millones aquí y 311 millones allí, lo que da una tasa de 14 archivos por millón de habitantes en España y 3,8 en Estados Unidos. ¡¡La cosa es aún peor, somos los primeros del mundo!!

Tranquilícense, porque afortunadamente Uruguay nos saca del apuro, ya que con sus 140 archivos al día y sus 3,5 millones de habitantes, tienen una tasa de 40 archivos por millón, tres veces más que la nuestra y 10 veces más que la estadounidense, lo que nos vuelve a dejar en segundo lugar. ¿Qué habrá en Uruguay para que estén tan corrompidos?

Seguramente nada, porque estos datos tienen serios problemas, como cualquiera medianamente sensato puede comprobar. El ranking lo ha hecho la Fundación Alia2, que tiene un software que explora la red (en particular redes P2P) en busca de archivos de contenido pedófilo, e identifica en qué país está el ordenador que lo aloja. El informe donde lo cuentan está aquí. Y en él aparece este gráfico de la vergüenza (¿para España?, ¿para los autores?, ¿para los medios?) con el número medio diario de archivos encontrados en 2010 en diferentes países, que ha sido reproducido por muchos medios (entre otros, en papel, El País y Abc):




Ellos pretenden que la búsqueda es exhaustiva, y los resultados fiables a nivel global, pero los datos están diciendo a gritos que no es así. Es imposible tomarse este ranking en serio, y creer que hay tres veces más archivos pedófilos en ordenadores de uruguayos (3,5 millones de habitantes, 1,8 millones de usuarios) que de brasileños (201 millones, 76 millones de usuarios), lo que haría a los primeros unas 100 veces más propensos que los segundos a la pedofilia informática. Por no hablar de todos los países con aún más millones de usuarios que Brasil, que ni siquiera aparecen en la lista, como Japón (99 millones de internautas), China (420 millones), o India (81 millones).

La presencia entre los "top ten" de cinco países hispanoparlantes, de muy diversos tamaños, y la ausencia de otros países decenas de veces mayores hace sospechar que con casi total seguridad su método de búsqueda tiene sesgos, o bien idiomáticos (por los criterios de búsqueda), o bien relacionados con las redes en las que buscan, que no estarán igualmente implantadas en todos los países (y la popularidad diferencial de una red puede ir a su vez unida a la lengua).

¿Y cómo han producido estos datos? Pues la explicación es bastante concisa (pág. 14):
El programa Florencio es una herramienta desarrollada por la Fundación Alia2. El sistema Florencio permite detectar el intercambio de archivos con posible contenido pedófilo a través de la redes P2P. Éste se lleva a cabo gracias a que el programa utiliza los buscadores de estas redes a través de palabras clave, tras las cuales se pueden ocultar los archivos en cuestión.

En base a las palabras insertadas, se detectan una serie de archivos que, por los vocablos referidos en el título, son susceptibles de contener pornografía infantil.

A través de esos archivos encontrados se obtiene la hash (identificador único del archivo) del archivo. A su vez, también se obtiene la dirección IP donde se encuentra almacenado. Pudiéndose determinar de dónde viene así como registrar el usuario que lo ha compartido en esas redes, siempre en base a países.
O sea, que el punto de partida es la búsqueda por palabras clave. ¿En qué idioma? Más abajo dicen que la búsqueda ha sido en inglés. ¿Y no se habrán colado algunas palabras en castellano? Lo digo porque la herramienta Florencio, según su página web, ha sido desarrollada para ayudar a las fuerzas de seguridad, y se utiliza solo, de momento, por la Guardia Civil española. Tal vez la tienen corriendo separadamente, por un lado para hacer estadísticas internacionales (y sólo usan nombres en inglés) y por otro lado para buscar pedófilos en España (y ahí meterán, además, el castellano). ¿O tal vez no? En todo caso, ni chinos ni japoneses hablan mucho inglés. Eso solamente sería descalificador para una herramienta que pretende ser global.

Por otra parte, de las redes rastreadas, dicen: "centradas en aquellas de carácter general". ¿De carácter general en dónde? ¿En todo el mundo? ¿O según el criterio de observadores expertos que están en España?

La explicación que ellos dan para la baja presencia de países de Asia o África está en la baja penetración de Internet y/o la censura (para China). Lo último podría ser cierto, pero no se aplica a los otros gigantes asiáticos. Y ninguna de las dos funciona para otros grandes países europeos ausentes.

Vamos, que a menos que asumamos que hay algo en la cultura hispanoparlante que nos hace especialmente pervertidos (supongo que el Abc no apoyará esta teoría) la explicación más lógica para este ranking absurdo es que la herramienta utilizada tiene sesgos que le llevan a detectar más archivos en unos países que en otros. Simple y obvio, excepto para el conjunto de la prensa española, que no se ha enterado, o no ha querido hacerlo.

Actualización: se me había pasado este texto maravilloso de la noticia del Abc, basado, entiendo, en la rueda de prensa:
Parte esencial de ese trabajo es una herramienta informática llamada Florencio, que facilita la búsqueda de archivos en las redes p2p (se han examinado cuatro de las más populares en España, aunque Miguel Comín, cofundador de Alia2, prefiere no citar sus nombres). [negrita original, rojo añadido]

¡Acabáramos!

15 comentarios:

  1. Que no aparezca Japón ya es raro dada la cantidad de material que hay rozando la frontera de la pornografia infantil: rorikon, lolikon, hentai, anime. O la manera que tienen de promocionar algunas estrellas infantiles ( http://javimoya.com/blog/2006/04/05/pornografia-infantil-legal-en-japon/ ).
    Misteriosamente tampoco aparece nada de Rusia y siendo este un "negocio" subterranea que mueve mucha pasta negra, pero que muy negra, ya es extraño que los estan metidos en varios submundos lucrativos de internet no den señales de vida ¿será por el alfabeto cirílico?

    ResponderEliminar
  2. A mi todas estas noticias me parece que llevan el mismo mensaje subliminal:
    "La red es insegura, peligrosa y una fuente de criminales. Requiere más control"

    ResponderEliminar
  3. Por fin un post con chicha, con trabajo de análisis, y que aborda temas tratados por varios medios y además en papel.

    Yo también creo que debería haber menos información circulando libremente en internet. Por ejemplo, la de los periódicos, que debería ser de pago.

    ResponderEliminar
  4. La recurrente estulticia de la prensa hace que un simple análisis basado en el sentido común parezca un hallazgo genial... pero es que dado el panorama que tenemos, casi lo es.

    ResponderEliminar
  5. Yo creo que influye el hecho de que en las redes P2P ahora mismo la mayoría de usuarios son hispanohablantes, ya que en el mundo anglosajón se tiende mucho más a descargas directas en forums y similares.

    ResponderEliminar
  6. Miriam: ¡Anda, hermana, si frecuentas los mismos interneses que yo!

    ResponderEliminar
  7. Una nota para Daryl.

    Rorikon y Lolikon de hecho son lo mismo (http://en.wikipedia.org/wiki/Lolicon) y lo que mas roza "de facto" la pornografía infantil.

    Hentai es el subgenero "porno" del manga, sin mas connotaciones pedofilas asi de entrada que en el porno occidental. El lolicon de hecho es una subcategoria del hentai.

    Anime es simplemente "dibujo animado japones". Hay animes hentais e incluso lolicons, pero tambien Heidi, El viaje de Chihiro o Akira son animes, por ejemplo.

    La regulación (o su falta) de la pornografía infantil en Japon daría para una tesis. Hay grandes diferencias culturales y legales.

    En todo caso poner lolicon, hentai y anime en el mismo saco es injusto y contribuye a dar al manga una reputación de "solo sexo y violencia" muy injusta.

    Una servidora es fan del manga, por si no se nota ;D

    ResponderEliminar
  8. Se te ha pasado comentar que son "susceptibles de contener pornografía infantil" y que tras las palabras clave "se pueden ocultar los archivos en cuestión". Es decir, que ni siquiera valora el contenido de los archivos, sino su posibilidad (imaginemos, por ejemplo, que buscan ficheros por la palabra clave "Lolita", que pueda implicar distintos significados).

    ResponderEliminar
  9. lamastelle-tiquismiquis12 de febrero de 2011, 12:00

    "¿Qué habrá en Uruguay para que estén tan corrompidos?"

    Si, es lo que pasa, se han corrompido tamnto, que ya son corruptos :-). Pienso que quedaria mas correcta el participio irregular, pues se usa como adjetivo.

    Postdata: Habria que saber, ademas, que es un archivo pedofilo o no. Porque por poner un ejemplo totalmente realista, si segun la ley en USA eres menor hasta los 21 años y me vigilan mi ordenador lleno de fotos de modelos de 19 añitos escasas de ropa...

    ResponderEliminar
  10. Francamente, ¿qué podemos esperar de una herramienta informatica de búsqueda global que se llama "Florencio"?

    ¡un poco de seriedad, cojón!

    ¡Un saludo!

    ResponderEliminar
  11. ¡Y encima es una herramienta de pago!

    Esta noticia no es más que una variante del clásico "España es el país que más piratea del mundo mundial", según un estudio de una empresa española encargado por una asociación española y publicado en la prensa española.

    Nadie se plantea que en otros países como EEUU también hay internet, que de hecho la usa mucha más gente, y que casualmente los programas P2P, las páginas de descarga etcétera NUNCA SE CREAN, DISEÑAN, CONCIBEN NI ELABORAN EN ESPAÑA.

    ResponderEliminar
  12. Pues la verdad es que son datos realmente curiosos y se puede jugar con las matemáticas y la estadística y los despropósitos para ver los mismos datos desde diferentes ópticas y opinar cosas que pueden ser incluso completamente diferentes, claro que todo ésto también depende además de cuan homogénea sea realmente la distribución cuando se hacen generalizaciones.

    Vamos a utilizar parte de los datos ya facilitados y otros que suponedremos para efectuar dichas comparaciones (odiosas como casi siempre), para el caso español tenemos una media de 645 ficheros para 29 millones de internautas; estos datos que nos sitúan en cabeza (o casi), en cambio, expresados por 100.000 internautas suponen 4,5 ficheros. De la distribución de países y por lo que se comenta (o justifica) de los paises asíaticos supongamos por un momento que el siguiente país (11 y que quedaría fuera de los top-ten) fuese Japón y que según las cifras de Internet World Stats (IWS) son 99 millones de internautas, si suponemos que tiene menos ficheros que el décimo país (Venezuela: 48,18) pero muy cerca de éste, asumamos un valor de 48,17; con estos datos y por 100.000 internautas a Japón le tocarían 205 ficheros y en ese caso serán 3,41 veces peores que los españoles. Presentado de este modo queda claro el peligro de los valores absolutos y relativos y de la asunción de distribución homogénea cuando además hablamos de personas y comportamientos humanos ya que llevados al extremo se podría pensar que hay un solo japonés de 100.000 que tiene 205 ficheros de este tipo (algo que no necesariamente tiene que ser imposible) mientras que si son cuatro los españoles que albergan los 4,5 fichros anteriormente mencionados (tendríamos que pensar qué hacemos con lo de un fichero de 0,5 de fotografía o lo que sea …) entonces somos nosotros 4 veces peores que los japoneses (en realidad que ese único supuesto japonés) lo que claramente demuestra que la suposición de homogeneidad es solamente eso: una suposición no demostrada.

    Dicho sea todo ésto con el mayor respeto para el pueblo japonés que ha demostrado una vez más su dignidad y espíritu de superación ante las adversidades que el terremoto y tsunami les ha causado y con mi más sincero pésame por los casi 20.000 fallecidos a causa del siniestro. La elección de Japón en representación de Asia está exclusivamente motivada por cuestiones estadísticas del número de internautas (3,5 veces los españoles) y la suposición de que allí la censura no se aplica a diferencia de como se supone en China.

    Pero continuando aún más lejos en las comparaciones y para demostrar que ni los valores relativos pueden ser representativos cuando los valores absolutos difieren en varios órdenes de magnitud consideremos en caso del Vaticano, según IWS se contabilizan 480 internautas, bastaría un solo fichero para que por 100.000 habitantes representasen un cifra equivalente a 208,33 o lo que es lo mismo: 46,35 veces peores que nosotros y a un nivel similar al japones del ejercicio anterior, pero claro como podemos equiparar 480 internautas a 99 millones y 1 fichero a 205, suponiendo ademas que la herramienta de detección utilizada tiene una tasa de error tan pequeña capaz de detectar ese único fichero porque ni me atrevo a revisar los cálculos si en vez de un fichero fuesen dos (por aquello de la tase de error).

    ResponderEliminar
  13. Y seguimos …

    Otro detalle del que no se ha realizado el menor análisis, al menos expresamente manifestado, es la asociación entre la identificación de las máquinas por país según su dirección ip y su correspondencia con un usuario de dicha nacionalidad; por poner un ejemplo, en España sabemos que no hay un solo inmigrante, o de haberlo no tiene posibilidad de acceso a las redes objeto del análisis, o de tenerlo no tiene la intención de delinquir, y también siendo justos con todos el mismo análisis se aplica en sentido contrario no dudando de la honestidad de nuestros emigrantes; lo cual puede resultar un tanto extraño dado que según parece en las cárceles españolas hay reclusos extranjeros y supondremos que hay españoles cumpliendo igualmente condena en el extranjero, por lo que no parece quedar clara la asociación nacionalidad dirección ip-nacionalidad usuario si no se dispone de información más detallada y otro tipo de datos


    Queda claro con estas simplezas, que en todo momento son datos puramente estadísticos sin ninguna intención de juzgar ni comparar (salvo matemáticamente), con qué facilidad se puden utilizar datos sesgados, o que sin serlo arrojan conclusiones que pueden serlo. Dado que sin concer más detalles sobre una distribución, bien sea su media, varianza, moda, coeficiente de asimetría, kurtosis, etc...; cualquier opinión es relativa y sus conclusiones y comparaciones pueden ser más que dudosas si además introducimos la incertidumbre asociada a las ciencias sociales puesto que en este caso además los numeros representa a personas y opiniones que no tienen un comportamiento tan determinista como los número enteros o los reales, matemáticamente hablando.


    En cualquier caso no se pretende deslegitimar los objetivos de Alia2 respecto del problema de la pornografía infantil, que es y debe seguir siendo considerada un delito, sino sobre la falta de rigor en muchas de las informaciones que se facilitan y su posterior tratamiento y difusión por parte de la prensa.

    Lamento la extensión del rollo, pero ser mínimamente riguroso y breve al mismo tiempo no siempre es posible y a veces, directamente imposible.

    ResponderEliminar
  14. Anónimo, te has liado un poco (bastante).
    Tu argumento sobre números relativos y absolutos puede valer, pero el ejemplo que das está mal.
    España: 645 ficheros para 29 mill. internautas: 22,2 ficheros/millón
    Japón, aunque tuvier 48,17 ficheros para 99 millones de internautas: 0,48 ficheros/millón.

    ResponderEliminar

Si quieres que otros lectores puedan debatir contigo, por favor, no firmes como "Anónimo" a secas. Usa la opción "Nombre/URL" e invéntate un nombre, aunque sea "Anónimo33", "ABC" o "123", para que podamos dirigirnos a ti. Gracias.