COMPUTACIÓN EN LA NUBE

Clarín explica cómo exprime datos de lectores para conseguir ventas por 40 millones de pesos

El objetivo de este proceso es que el dato ofrezca pistas de cómo tener más suscriptores y retenerlos, además de vender más diarios en papel
TECNOLOGÍA - 29 de Mayo, 2019

El grupo Clarín aprovecha el poder de cómputo de la nube informática para exprimir los datos que dejan sus lectores en sus diversas plataformas y conseguir así nuevos ingresos por unos 40 millones de pesos en el último año y medio.

En una conferencia de prensa en las oficinas porteñas de Oracle, el segundo mayor fabricante mundial de software, y en la que estuvo iProUP, un alto ejecutivo del grupo explicó en detalle cómo emplean la tecnología provista por la compañía californiana.

Agea es la división de Clarín que produce una serie de sitios dedicados a las noticias, el entretenimiento, la cultura, el deporte, las tendencias y la vida cotidiana. En 2015 Pablo Giudici, gerente de Big Data & Analytics de Agea, llegó a esta compañía, donde comprobó que los activos de datos del mayor grupo de medios argentino era preocupante. 

El diagnóstico que compartió ante los periodistas es similar al de muchas empresas: había dificultades para registrar y ubicar la información necesaria para la toma de decisiones.

También había desconexión, porque diferentes áreas buscaban el mismo dato pero en forma distinta. Otro problema era la inconsistencia: una misma consulta ofrecía respuestas dispares y hasta contradictorias, según el área que respondía.

El grupo Clarín tiene 73 años. Edita los diarios Clarín y Olé, y el programa de lealtad 365, entre otros. En todos ellos utiliza sistemas para registrar al lector, y luego de cierta cantidad de lecturas exige al usuario dejar sus datos para seguir accediendo a la información hasta condicionarlo al pago de una suscripción.

Inversiones informáticas

Giudici advirtió la necesidad de invertir en software y hardware para reunir la información existente, con datos de las transacciones de los suscriptores y sus reclamos. Esta inversión permitió recoger información nueva, como la que generan las interacciones en redes sociales y obtener analíticas.

El gerente que encabeza el proceso de transformación digital de Agea dijo que su "visión en ese momento fue que todo lo que hiciéramos relacionado con Big Data debía tener un valor de negocios". "Había también una pata de inversión en tecnología, que tenía que hacer que fuéramos eficientes", advirtió.

El siguiente dato demuestra cómo evolucionó este proceso: cuando Giudici inició este proceso, había sólo tres personas en el área de Big Data & Analytics. Hoy suman 15 y a fin de año serán 20. "En ese momento no éramos muchos, pero era mucha la cantidad de información. Hablamos de mil millones de registros por mes. Imaginen una planilla de Excel con mil millones de filas por 300 columnas por mes", recordó el gerente.

El plan de inversiones se inició con un "appliance" de Teradata, que se instaló en el centro de datos del grupo. Este equipo tenía cierta capacidad de procesamiento para grandes volúmenes de datos, aunque no tenía la capacidad máxima.

Había un obstáculo: la base de datos tradicional, por la cual al equipo le costaba convertir la información que tenían de grandes cantidades de texto provenientes de los artículos del diario, direcciones web, resultados de analíticas, en algo que la base de datos pudiera almacenar.

Por culpa de ello, el equipo de analítica dedicaba la mayor parte del tiempo a la carga de datos y a guardar su calidad. Este paradigma informático, basado en los recursos del appliance (memoria, espacio en disco, capacidad de procesamiento) se vio desbordado.

Es que para crecer, el grupo debía incorporar más hardware, con mayores costos de servidores, los tiempos de espera por su importación, despliegue y configuración. Todo este proceso demandaba, según Giudici, "de seis meses de espera y cientos de miles de dólares de costo". En ese momento empezaron a evaluar otras opciones.

Nueva base de datos

La elección recayó en Autonomous Data Warehouse Cloud, un servicio ofrecido por Oracle desde su propia nube, que permite ahorrar en operaciones e infraestructura de hardware y minimizar las tareas de los administradores de bases de datos (DBA, sigla en inglés). Y además se autocorrige.

En la conferencia de prensa, Hernán Serra, ingeniero principal de Soluciones del equipo de gestión de datos de Oracle, advirtió que las bases de datos tradicionales no tienen capacidad para lidiar con la explosión de datos generada por las nuevas tecnologías.

Serra señaló que "hoy todas las bases de datos pueden ser críticas porque cada pieza de información adicional puede significar nuevos ingresos, o acceso a nuevos mercados. Es en función de este desafío que Oracle crea una base de datos autónoma".

¿Por qué se llama "autónoma"? La base de datos puede realizar tareas por propia iniciativa, sin intervención humana, para garantizar disponibilidad y desempeño cuando atiende las consultas.

Este servicio, que se ofrece desde la nube de Oracle con base de datos que corre sobre equipos Exadata, automatiza muchas de las tareas que deben realizar los DBA. El sistema aprende cómo se utiliza la base de datos y observa cómo puede mejorar el desempeño de estos procesos, mientras se autocorrige y configura en forma constante.

Al estar en la nube, tiene una tasa de resiliencia muy alta y alta disponibilidad. Oracle se encarga de hacer copias de respaldo y de recuperar el sistema en caso de desastre y no requiere recursos dedicados al hardware.

¿Cómo fue el proceso de subir desde Agea los datos a la nube? "Directamente determinamos el espacio que necesitábamos, creamos una instancia y salimos andando, aprovechando el entorno que ya habíamos creado previamente", explicó Alejandra Casaza, coordinadora de Proyectos de Big Data en Agea.

Casaza señaló que a medida que la base de datos aprende de las consultas que se le hacen, agrega los índices que cree necesarios, sin intervención humana.

Giudici aseguró que se aprovecha el aprendizaje que la base de datos tiene en otros procesos y análisis. En este caso, la ventaja es la integración y la ejecución desde la nube. Este tipo de herramientas permiten que un área no técnica pueda desplegar pequeños "datawarehouses" departamentales", para conocer en profundidad la audiencia y mejorar la conexión con ella.

El objetivo de este proceso es que el dato ofrezca pistas de cómo tener más suscriptores y retenerlos, además de vender más diarios en papel, averiguar los diferentes tipos de personas que visitan los portales web y cuándo optimizar la publicidad, etcétera. "Hablamos de una innovación basada en datos para descubrir nuevas oportunidades de negocios", dijo Giudici.

La inversión del área de Big Data & Analytics en esos tres años iniciales del proceso fue de unos 25 millones de pesos. Gracias a las mejoras en el conocimiento de los individuos, facilitada por las aplicaciones en la nube, en un año y medio Agea recaudó unos 40 millones de pesos por ventas personalizadas.

En el siguiente video, Giudici explica las características del proceso:

En la siguiente galería de fotos de iProUP, parte de la presentación de Giudici en la conferencia de prensa:

Objetivos del proceso de transformación digital de Agea a partir del paso a la nube.
Consecuencias del paso de observar audiencia s a observar individuos.
La evolución del valor del dato y el tiempo de ejecución del proceso entre 2015 y 2018.
La transformación digital ofrece una visión 360 grados del usuario registrado en las diferentes plataformas de Clarín, que no incluyen a Artear (canal 13 y Todo Noticias) y Radio Mitre, entre otros medios.
La omnicanalidad, una cualidad creciente en el comercio digital se consigue con este proceso de transformación digital.
La analítica predictiva se basa en estos 4 pilares tecnológicos.
La mejora en la calidad de datos permite identificar muchas variables de los usuarios registrados.
Clarín clasifica a los usuarios de sus plataformas en cuatro grupos.
Los distingue también por sexo y edad.
Y por franjas de navegación de los grupos.
Dispositivos con los que ingresan a las plataformas.
En el caso de Clarin.com, estos son los datos referidos a los dispositivos desde los cuales ingresan los usuarios registrados.
El grado de refinación es tal que permite identificar los temas más interesados por cada grupo.

Te puede interesar

Secciones