iProfesionaliProfesional

Sentiment Analysis: cómo los datos expresan los sentimientos

Hasta hace algunos años era muy difícil extraer información relevante de estos datos. Esto cambió gracias al aporte del Deep Learning
15/11/2021 - 12:05hs
Sentiment Analysis: cómo los datos expresan los sentimientos

El "sentiment analysis" es el proceso de detección y análisis de sentimientos en un conjunto de datos. "Se utiliza, por ejemplo, para medir el efecto de campañas publicitarias, de políticas públicas, o también a nivel académico, dado el impacto que los sentimientos tienen en la toma de decisiones."

La manera más sencilla de acceder a esta información es cuando se encuentra de forma estructurada, es decir, que se puede contabilizar como si fuera una tabla de Excel. Los sentimientos en los datos estructurados pueden identificarse, por ejemplo, en los likes de Facebook, la puntuación que le damos a una película o un producto, o en encuestas.

Pero el gran auge del sentiment analysis se generó con la posibilidad de extraer sentimientos de los datos no estructurados: texto, imágenes o audio. Esto se debe a que hoy en día el mundo -especialmente el universo intermediado por internet- está sobre abastecido de estos contenidos.

Hasta hace algunos años era muy difícil extraer información relevante de estos datos. Esto cambió gracias al aporte del Deep Learning dentro del campo de la inteligencia artificial.

Todo el tiempo convivimos con este tipo de transformaciones, aunque no siempre somos conscientes de ello: YouTube genera automáticamente subtítulos del audio de un video, Google Photos reconoce a nuestros amigos en las imágenes que subimos, validamos nuestra identidad para un trámite sonriéndole al teléfono, un bot convierte a texto el audio que nos mandó nuestro jefe y un cartel gigante muestra la patente de nuestro auto cuando entramos o salimos de Capital Federal. Tanto YouTube, Google, la ANSES, Voicy, como el GCBA usan redes neuronales para convertir esos mensajes en información. Que esto sea posible impulsó fuertemente el auge del Big Data.

Si bien el acceso a datos es cada vez más sencillo, una parte importante del problema que busca resolver el sentiment analysis se enfoca en cómo convertir esos grandes volúmenes de datos en información relevante para luego utilizarse tanto en el ámbito académico, empresarial, político y más.

A nivel académico, por ejemplo, se analiza el impacto del humor social expresado en Internet (blogs y microblogs) respecto de la actividad financiera o económica (inflación, tipo de cambio, nivel de actividad general o de algunos rubros en particular, etc.).

También, entre otros, existen estudios que analizan los diarios mirando especialmente las imágenes (los rostros) que publican, o la aparición de determinadas palabras clave en las noticias.

Claramente extraer la información directamente de Internet será mucho más barato que organizar encuestas o focus groups. Pero, la identificación del sentimiento es muy importante, porque muchas veces no alcanza para que una campaña publicitaria logre que se hable, porque podría ser que se esté haciendo referencia a ella, pero negativamente.

En lo que respecta a la política y a la gestión de gobierno, sentiment analysis se emplea para medir el impacto de campañas o de aplicación de políticas. También se puede usar para identificar preocupaciones, intereses de la sociedad, intención de voto, etc.

En general, las redes sociales son una gran fuente de datos para este tipo de análisis. La gente vuelca allí todo tipo de opiniones, fotos y videos. Resulta particularmente interesante que muchas veces las publicaciones contienen información respecto a la ubicación desde la que fueron hechos los posteos, lo cual permite identificar la prevalencia de determinados sentimientos en un lugar en particular.

Existen, por ejemplo, estudios que con esta información buscan identificar la intención de voto por distrito. Desde el otro lado, las redes sociales también utilizan esta herramienta para filtrar publicaciones con mensajes de odio o violentos con el fin de eliminarlos si incumplen con los términos de uso de la red, u ofrecer ayuda.

Los datos recolectados en Internet permiten inferir los sentimientos populares.
Los datos recolectados en Internet permiten inferir los sentimientos populares.

Redes sociales y buscadores

Uno de los primeros puntos a tener en cuenta a la hora de hacer sentiment analysis sobre redes sociales es que la gente no suele poner en las redes exactamente lo que piensa o lo que siente.

Si no tuviéramos en cuenta estos factores, uno podría hacer un análisis sobre fotos en Instagram y concluir que la sociedad está extremadamente feliz. Esto se debe a que, generalmente, la gente se saca fotos cuando la está pasando bien con amigos y sonriente.

Una fuente de información interesante y que funciona mucho más honestamente es la compilación de lo que la gente busca en Google. Al tratarse de búsquedas anónimas, los usuarios escriben preguntas, intereses y preocupaciones con mucha libertad.

Aunque algo de información siempre va a ser mejor que nada, los algoritmos nunca van a lograr una identificación ciento por ciento certera del sentimiento detrás de los datos. La ironía, el sarcasmo, o ciertas expresiones idiomáticas, por ejemplo, son muy difíciles de detectar para una computadora, pero muy presentes en lo que las personas publican en Internet. Incluso el ser humano muchas veces equivoca la interpretación.

Las aplicaciones de smartphones recogen mucha información sobre los sentimientos de los usuarios.
Las aplicaciones de smartphones recogen mucha información sobre los sentimientos de los usuarios.

En la Argentina el sentiment analysis se utiliza especialmente en lo textual. En lo que respecta a imágenes y audio el desarrollo es más incipiente. En general las grandes empresas tienen sectores propios que se encargan de este tipo de estudios, entre otros aspectos.

Todavía no existe una metodología capaz de sustituir el uso de encuestas para la predicción de voto, o intenciones de consumo; sin embargo, es de esperar que en los próximos años esta forma de análisis se utilice, al menos, para mejorar el método tradicional.

(*) Docente de la Licenciatura en Analítica Empresarial y Social del ITBA.