El INEGI incursiona en el mundo del “Big Data” para explorar la utilidad de fuentes no tradicionales de información a fin de vincularlas con la generación de información estadística y geográfica y hoy presenta el Estado de ánimo de los tuiteros en México, un trabajo experimental para el “análisis de sentimientos”, con el objetivo de interpretar la emotividad que subyace a los mensajes que se publican en la plataforma digital Twitter.

Esta herramienta es un esfuerzo por medir el bienestar “más allá del PIB”2. En este caso no se refiere a bienestar autorreportado, como ocurre con estadísticas que el mismo INEGI genera en sus encuestas BIARE, sino de bienestar inferido a partir de la carga anímica implícita en los mensajes publicados en Twitter.

Es el ejercicio de generación de información estadística con más alta frecuencia que el INEGI haya realizado hasta ahora y, por sus características, una herramienta única a nivel mundial.

Las técnicas de aprendizaje de máquina permitieron entrenar a una computadora para replicar el criterio humano en la identificación de la carga emotiva de cada tuit: negativa o positiva. Se clasifica cada tuit y a partir de ello se construye un indicador que relaciona el número de tuits asociados con una carga emotiva positiva (tuits positivos) por cada tuit asociado con una carga emotiva negativa (tuits negativos).

A este indicador lo llamamos el “cociente de positividad” y se define como el número de tuits positivos entre el número de tuits negativos para una determinada área geográfica en un periodo de tiempo determinado.

Así, el Estado de Ánimo de los Tuiteros en México reporta un cociente de positividad a partir de enero de 2016 con actualización automática diaria, que puede ser visualizado para el país en su conjunto y para cada una de sus entidades federativas con frecuencia anual, trimestral, mensual, semanal, diaria e incluso por hora.

La evolución del cociente de positividad permite visualizar cómo los estados de ánimo positivos y negativos se difunden en mayor o menor medida entre la población tuitera y los cambios de esa difusión de un periodo a otro y de una entidad federativa a otra. Esto nos permite atisbar en aspectos de nuestra realidad nacional que adquieren mayor relevancia en la medida en que se extiende el uso de redes sociales digitales a través de Internet.

Dado que es probable que los cambios en el cociente de positividad emotiva no sean meramente aleatorios, resulta de interés indagar acerca de los hechos o noticias que pudieran estar asociados con el incremento o la disminución en el mismo.

La sensibilidad del Estado de Ánimo de los Tuiteros en México para captar de manera automática el impacto emotivo de cambios relevantes en el entorno se puso a prueba con los recientes sismos del 7 y el 19 de septiembre de 2017 que afectaron a varias entidades federativas del país. Tanto el 8 de septiembre como el 19 de ese mes, presentan bajas importantes en el cociente de positividad en la serie nacional con frecuencia diaria y muestran el cambio del estado de ánimo de los tuiteros justo a partir de la hora en que ocurrieron los sismos.

La herramienta permite visualizar las reacciones diferenciadas por entidad federativa, de manera que mientras que la Ciudad de México presenta notables bajas en la positividad tanto el 8 como el 19 de septiembre, en Chiapas sólo se observa esa caída el día 8 y en Chihuahua no se aprecia algún cambio importante en ninguna de las dos fechas.

Conviene tener presente que no todos los movimientos en las series de los cocientes de positividad tienen una interpretación evidente u obvia. En este sentido, los usuarios pueden complementar la información de que disponen con la que ofrece el sistema para enriquecer su explicación de las variaciones del estado de ánimo de los tuiteros. La plataforma permite asociar cada observación con una nube de hashtags y también con las noticias del día, cuando el análisis se hace con una frecuencia diaria.

A diferencia de lo que ocurre con las fuentes estadísticas tradicionales como las encuestas o los censos, la información de redes sociales no responde a un diseño conceptual, estadístico y operativo orientado a conocer aspectos específicos de nuestra realidad, sino que reaprovecha para fines estadísticos, información que en principio fue creada para otros propósitos.

La herramienta del Estado de Ánimo de los Tuiteros en México está disponible en la página del INEGI en internet (www.inegi.org.mx), en la sección de investigación/estadísticas experimentales y se puede acceder directamente mediante la liga: https://cienciadedatos.inegi.org.mx/animotuiterov2/web/.

El INEGI ha decidido incursionar en el mundo de lo que se conoce como “Big Data” para explorar la utilidad de fuentes no tradicionales de información a fin de vincularlas con la generación de información estadística y geográfica. Como un primer paso en esta dirección, ha emprendido de manera experimental el “análisis de sentimientos” mediante la implementación de técnicas de aprendizaje de máquina a la interpretación de la emotividad que subyace a los mensajes que se publican en Twitter.

Las técnicas de aprendizaje de máquina permiten entrenar a una computadora para que replique el criterio humano en la identificación de la carga emotiva de cada tuit, ya sea ésta negativa o positiva; lo que a su vez permite clasificar los tuits y a partir de ello construir un indicador que relaciona el número de tuits asociados con una carga emotiva positiva (tuits positivos) por cada tuit asociado con una carga emotiva negativa (tuits negativos). A este indicador lo llamamos el “cociente de positividad” y lo definimos como el número de tuits positivos entre el número de tuits negativos para una determinada área geográfica en un periodo de tiempo determinado.

Así, el Estado de Ánimo de los Tuiteros en México 2.0 reporta un cociente de positividad a partir de enero de 2016 con actualización automática diaria, que puede ser visualizado para el país en su conjunto y para cada una de sus entidades federativas con frecuencia anual, trimestral, mensual, semanal, diaria e incluso por hora. En este sentido, se trata del ejercicio de generación de información estadística con más alta frecuencia que el INEGI haya generado hasta el momento. Asimismo, por sus características, el Estado de Ánimo de los Tuiteros en México 2.0 es una herramienta única a nivel mundial.