iProfesionaliProfesional

¿Cómo se utiliza el "Big Data" con fines electorales?

"El error más común es generalizar toda la Nación sobre la base de un tamaño muestral muy pequeño", advirtió el cientista de datos Mathias Longo
05/08/2019 - 10:17hs
¿Cómo se utiliza el "Big Data" con fines electorales?

En la siguiente entrevista de iProfesional, Mathias Longo, científico de datos de Retargetly, empresa que provee una plataforma de gestión centralizada que permite a los anunciantes crear audiencias objetivo a las que dirigirse basándose en una combinación de datos de diferentes fuentes, explica los usos del "Big Data" en el marco de una campaña electoral.

-¿A qué se llama Big Data?

-Big Data es el área científica que se encarga del estudio, del procesamiento y de la estimación de datos en volúmenes más grandes que los tradicionales. Con respecto al tamaño de dichos volúmenes, no existe una especificación unánime, pero la mayoría de los analistas y de los profesionales se refiere a conjuntos de datos que van desde los 30 a los 50 Teras hasta los varios Petabytes.

Y si bien la cuestión del tamaño determina la exigencia de desarrollo de tecnología acorde para poder capturar, manipular y almacenar esa dimensión informativa, lo que más importa es qué hacen las organizaciones con ella. El Big Data se puede emplear para obtener ideas que conduzcan a la toma de mejores decisiones y a movimientos de comunicación estratégicos.

-¿Qué es y qué no es Big Data en una campaña electoral?

-Dentro del contexto de una campaña electoral, y siguiendo con la definición anterior, consideramos Big Data al estudio de un grupo de personas superior al tamaño de una muestra convencional (500 personas). Además, no se trata solo de cantidad de personas encuestadas y estudiadas, sino también de la cantidad de variables consideradas para cada caso.

-¿Cuáles son los datos relevantes que necesita Big Data para aplicarse en una campaña electoral?

-El ideal es entender el/los perfiles de los conjuntos de personas que votan cada grupo electoral. Para estimar el perfil de dichas personas, se deben considerar diversas variables, tales como disposición geográfica, la distribución demográfica, los intereses, los hábitos de consumo, etc.

-¿Cómo se recolectan los datos para alimentar Big Data en la campaña electoral? Por ejemplo, ¿con rastreos manuales en redes sociales y en bases de datos de todo tipo, como la Encuesta Permanente de Hogares del Indec?

-Redes sociales es una de las fuentes más utilizadas para este tipo de estudios, dado que el usuario opina con pocos condicionantes. Además, se puede hacer un análisis de sentimiento y entender lo que le gusta y lo que no de las distintas propuestas.

Pero las redes sociales no son la única fuente externa a los datos abiertos; también es interesante entender los sitios que navega, las noticias que lee, lo que compra en un supermercado y comportamientos de otra índole. Todas estas son variables que ayudan a reforzar el entendimiento del perfil de cada usuario.

-¿Cómo se convierten los grandes volúmenes de información provenientes de redes sociales en información valiosa para una campaña electoral?

-Una manera directa es estudiar a aquellas personas que opinan públicamente acerca de algún punto de las elecciones y analizar el sentimiento (¿es positiva, negativa o neutral su opinión?).

También es funcional ver las opiniones o los intereses (a qué personas sigue) de aquellas que no emiten comentario acerca de la campaña. Con esta información, se pueden agrupar las opiniones a partir de barrios y contrastar con los datos del censo, por ejemplo.

-¿Cuáles son los errores más comunes en la aplicación de Big Data en campañas electorales?

-El error más común es generalizar toda la Nación sobre la base de un tamaño muestral muy pequeño. Esto lleva a sacar conclusiones apresuradas e imprecisas.

-¿Un algoritmo puede predecir el triunfo electoral de un candidato?

-Puede, pero no necesariamente su confianza será lo suficientemente grande como para acertar. Por eso es que, en este caso, se trabaja más en entender perfiles y analizar conductas. Eso da un estimativo de comportamiento y de planes de ejecución para mejorar las probabilidades de éxito.