Adam Sadilek, investigador postdoctoral en la Universidad de Rochester, ha presentado un estudio en la Conferencia Internacional sobre la búsqueda Web y Minería de Datos en Roma (Italia), donde muestra como la recopilación de datos de Twitter se puede aplicar para muchos de los factores que afectan a la salud y cómo puede complementar los estudios tradicionales en las ciencias de la vida.
«Si uno quiere saber cuántas personas están enfermas en una comunidad tiene que estudiar toda la población, lo cual es costoso y lleva mucho tiempo», afirma Sadilek, y añade «Twitter y la tecnología que hemos desarrollado nos permite hacer esto pasivamente, rápida y económica, podemos escuchar lo que dice la gente y extraer estos datos para hacer predicciones». Sadilek explica que muchos mensajes de Twitter son geo-etiquetados, lo que significa que llevan la información GPS que muestra exactamente dónde estaba el usuario cuando tuiteó. Recopilar toda esta información permite a los investigadores trazar, en el espacio y en el tiempo, lo que la gente dice en sus tweets.
El estudio de Sadilek se basa en datos de Twitter recogidos en la ciudad de Nueva York durante un período de un mes, en el que se tuvieron en cuenta factores como la frecuencia con la que una persona toma el metro, va al gimnasio o un restaurante en particular, su proximidad a una fuente de contaminación y su estatus social en línea. Se miraron 70 factores en total y se analizó si éstos tenían un impacto positivo, negativo o neutral en la salud de los usuarios.
Cualquier actividad conlleva riesgos para la salud
El documento también revela un patrón más amplio, donde prácticamente cualquier actividad que involucre el contacto humano lleva a un aumento significativo de los riesgos de salud. Por ejemplo, incluso las personas que acuden regularmente al gimnasio se enferman ligeramente más a menudo que las personas menos activas. Sin embargo, las personas que sólo hablan de ir al gimnasio, pero en realidad nunca salen (verificado en base a sus GPS), se enferman con mayor frecuencia. Esto demuestra que hay interesantes factores de confusión que ahora pueden ser estudiadas a escala.
La tecnología que Sadilek y su colega, el profesor Henry Kautz han desarrollado es una aplicación web llamada GermTracker. La aplicación parte de códigos de color de los usuarios (de rojo a verde) en función de su salud a partir de información de sus tweets por 10 ciudades de todo el mundo. Utilizando los datos del GPS codificados en los tweets de la aplicación se puede colocar a la gente en un mapa, que permite a cualquier persona que utilice la aplicación ver su distribución. «Esta aplicación puede ser utilizada por las personas para tomar decisiones personales sobre su salud. Por ejemplo, es posible que desee evitar una estación de metro si está lleno de gente enferma», sugirió Sadilek. «También podría ser usado junto con otros métodos por parte de gobiernos o autoridades locales para tratar de entender los estallidos de la gripe».
Desde hace algún tiempo Twitter se está utilizando para conocer la propagación de infecciones como la gripe o la propagación de incendios en tiempo real. Son datos muy útiles para investigadores pero también para las autoridades sanitarias, que pueden destinar sus escasos recursos en función de las necesidades previstas. Ahora se apunta un paso más, la posibilidad de conocer los riesgos a nivel individual.
See on: phys.org