Somos metadatos

Las nuevas redes sociales permiten a los usuarios compartir fácilmente enlaces, documentos, imágenes, videos y pensamientos a través de internet. Lo que muchos usuarios no conocen es que están compartiendo mucha más información a través de los metadatos. Cada actualización de estado, cada tweet y cada foto que tomamos incluyen unos metadatos que, por ejemplo, sirven a las fuerzas de seguridad para identificar a las personas que intentan ocultar sus identidades y ubicaciones y poder atrapar inadvertidamente a los delincuentes que no saben que estos datos pueden destruir su coartada.

En un nuevo trabajo titulado You are yourMetadata: Identification and Obfuscation of Social Media UsersusingMetadataInformation [PDF], unos investigadores del UniversityCollege y el Alan Turing Institute de Londres cuantifican hasta qué punto los metadatos que se incluyes en los mensajes de Twitter se pueden utilizar para una identificación extremadamente precisa de todos y cada uno de nosotros. Parece que todos nuestros tweets permiten rastrearnos con una precisión infalible independientemente del contenido del mensaje, solo mirando los metadatos.

En Twitter cada mensaje, aparte de los 140 caracteres, lleva asociados 144 tipos de metadatos distintos tales como como la fecha de creación de la cuenta, el momento en que se publicó un tweet, la cantidad de favoritos que ha dado esa cuenta, si la cuenta es verificada o no, cuántos tuits ha publicado, etc. Estos metadatos se utilizaron para entrenar a distintos algoritmos de aprendizaje automático de los que, según los investigadores, el más eficiente fue uno de los más básicos.

El entrenamiento de los algoritmos se realizó utilizando los tweets de un grupo de 10,000 usuarios de Twitter, desde los que se extraía un cierto comportamiento en Twitter en función de los metadatos de sus tweets creando un modelo por cada usuario. Tras esto, el sistema obtuvo un 96,7 por ciento de precisión identificando al autor de un tweet. Incluso cuando el 60 por ciento de los metadatos se pierden, el modelo aún podría identificar a un individuo con más del 95 por ciento de precisión.

Y, aunque estas pruebas se han hecho con Twitter, todas las redes sociales dejan rastro de los usuarios en esos metadatos, por lo que esto podría ser también válido para la mayoría de estas plataformas.

El anonimato no ayuda

Una de las primeras ideas que nos pueden pasar por la cabeza para intentar mitigar esto, sería la de intentar reducir los datos recopilados por las redes sociales y hacer que sean anónimos. Sin embargo,  según Beatrice Perez del Alan Turing Institute de Londres y coautora del estudio, “Es muy difícil anonimizar un conjunto de datos” ya que mediante triangulación de los datos existentes es fácil de deshacer cualquier intento de eliminar la información personal.

Pérez y sus compañeros lo demostraron al eliminar algunos campos de los datos recopilados para  para tratar de dificultar la tarea de identificación y aun así, la tasa de identificación se mantuvo estable hasta que todos los elementos únicos se eliminaron. “Si tuviéramos sólo unos pocos datos no borrosos, todavía sería fácil”, dice.

 ¿Cuánta información compartes?

Aunque a nadie se le ocurriría decirle a un completo extraño cuál es la dirección de su casa, a la gran mayoría de la gente no les importaría contarle con qué frecuencia encienden y apagan la luz de la habitación. Este es el peligro de los metadatos, ya que esta información puede ser combinada con otra similar para saber cuándo está en casa o no.

La mayoría de los usuarios en redes sociales no conocen la gran cantidad de información que comparten, por ejemplo, no saben que cada tweet tiene 144 fragmentos de metadatos, que son públicamente accesibles a través de la API del sitio.

Estudios como este pretenden alertar de la importancia de nuestra privacidad y de la información que compartimos ya que ésta puede ser utilizada en nuestra contra. Por ejemplo, la información recopilada puede ser utilizada para entender las inclinaciones políticas y religiosas de un usuario y actuar en consecuencia.

 

Javier García Castillo
Ingeniero Electrónica Industrial
Profesionales por el Bien Común

Fuentes:

https://www.microsiervos.com/archivo/internet/somos-nuestros-metadatos.html

 

https://www.wired.co.uk/article/twitter-metadata-user-privacy

Written by PBC

Profesionales por el Bien Común-Blog


Suscríbete a nuestro boletín de noticias por mail