iProfesionaliProfesional

¿Cuándo la imagen y el sonido reemplazarán al texto en Internet?

Sergio Borromei, director de tecnología de Lagash, explicó las características de este proceso y sus consecuencias en las personas y las organizaciones
31/01/2019 - 09:07hs
¿Cuándo la imagen y el sonido reemplazarán al texto en Internet?

Internet está en plena transición de un formato donde predominaba el texto hacia otro donde crece la influencia del audio y el video. Durante años, esta versión multimedia de la Red ganó terreno contra la Internet basado en texto. Sin embargo, entre 2017 y 2018 ese proceso se aceleró y ahora el audio y el video son imparables.

iProfesional entrevistó a Sergio Borromei, director de tecnología de Lagash, empresa especializada en desarrollo de tecnologías de realidad aumentada, inteligencia artificial y robótica, sobre este proceso y sus consecuencias en las personas y las organizaciones.

- Durante años, la Internet multimedia ganó terreno sobre la Red basado en texto. Sin embargo, entre 2017 y 2018 este proceso se aceleró en forma dramática y ahora el audio y el video son imparables. ¿Cuáles son las causas de este proceso?

- Este proceso se da por dos causas principales: por una lado, la infraestructura y el desarrollo tecnológico, que amplificaron exponencialmente las capacidades de streaming de audio/video sobre redes 3G/4G e hicieron un algoritmo muy sofisticado de compresión para sea más simple, ágil y rápido generar y compartir audios o videos por celular que tipear un texto en un teclado minúsculo y ocupando las manos.

Por otro lado, hay una causa vinculada al contenido, porque a través de un audio o un video podemos transmitir muchas otras cosas de forma inmediata que en formato texto, como por ejemplo, emociones, contexto de lugares o cosas, entre otras muchas mas.

Y entonces, al hacer mas práctico y sencillo el uso desde lo técnico, muchas personas optan por transmitir en audio y video. Con la llegada próxima del 5G, seguramente veremos este proceso acelerarse mas aún.

- ¿Puedes compartir un ejemplo de este proceso con alguno de los clientes de tu empresa o dentro de tu organización? Me refiero a interfaces basadas en multimedia en lugar de texto, tanto en aplicaciones como páginas web u otras herramientas tecnológicas.

- Hace unos años desarrollamos para Worknet la app que buscaba reemplazar el curriculum vitae con un video, brindando la posibilidad al postulante de contar su historia profesional.

Por otro lado, en la realidad aumentada y la realidad mixta también hemos experimentado con esta forma de yuxtaposición del texto sobre el contenido, en este caso, de la misma realidad observada. No obstante el "input" del usuario necesariamente ocurre a través de comandos de voz o gestos.

Actualmente la industria se encuentra en un ciclo acelerado de aprendizaje constante donde creamos tecnología, aprendemos del resultado de su aplicación, y luego volcamos ese aprendizaje en el inicio de un nuevo ciclo creativo.

- Asistentes de voz, celulares que detectan el rostro del usuario, la inteligencia artificial para buscar fotografías o traducir la lengua hablada, y la realidad aumentada son avances que se basan en las cámaras, los micrófonos, la voz, los oídos y los ojos. ¿Estos desarrollos provocarán la muerte del texto como interfaz del usuario?

- Es cierto que en el último tiempo hemos visto una evolución de interfaces que permiten evitar tener que escribir texto. Sin embargo, si de-construimos el mero acto de escribir, el teclado funciona como una extensión del pensamiento.

Tipeo, vuelvo atrás, corrijo la gramática, escribo nuevamente, re-leo y vuelvo a escribir. Esa dinámica es constitutiva del pensamiento y aún resulta difícil de reemplazar o mejorar mediante un algoritmo.

No obstante, no resulta muy arriesgado imaginarnos un futuro cercano donde asistentes virtuales de voz puedan lograr esa misma dinámica con el pensamiento, entablando un diálogo fluido con el usuario e incluso aumentando su capacidad reflexiva. Hoy la inteligencia artificial es muy eficiente para predecir o entender las intenciones de un usuario...

¿Llegaremos a un estado de arte en que la AI sea tan buena para generar preguntas que nos hagan reflexionar? Probablemente para ese momento la interfaz de texto escrito no sea tan necesaria.

- ¿Cuáles son las posibilidades más cinéticas de esta cultura en línea donde el texto se queda en el fondo, y los sonidos y las imágenes se convierten en el lenguaje universal?

- El texto nos constituye como seres humanos y nos otorga sentido. Nuestro pensamiento es texto... la configuración lingüística es nuestra forma de relacionarnos con la realidad y darle sentido a las cosas, e incluso nos limita. Wittgenstein nos decía "los límites de mi lenguaje significan los límites de mi mundo".

En ese sentido, sería impensable "lo humano" tal como lo conocemos por fuera del lenguaje o el texto, o en palabras de Jaques Derrida, "nada hay fuera del texto". Por lo tanto, podríamos decir que el texto siempre existirá, probablemente oculto en nuevas formas, pero texto al fin.

Entonces la pregunta que surge es si esta nueva forma de texto nos permitirá pensar mas rápido y mediante esa velocidad adquirida lograr expandir los límites de nuestro mundo. Del pensamiento surge la predicción, analizar las diversas posibilidades de futuro y otorgarles una probabilidad. ¿Podremos predecir con mayor certeza?

- ¿Ahora es más fácil comunicarse con las máquinas a través de imágenes y sonidos que mediante texto? ¿Quiénes usan más estas interfaces multimedia? Por ejemplo, ¿los millennials?

- Es curioso ver las cifras de adopción de asistentes virtuales como Siri. Según estudios se ha revelado que sólo un 15% de los usuarios de IPhone usan a Siri muy frecuentemente, pero muy rara vez lo hacen público. Por otro lado el 70% que lo utiliza lo hace cuando está conduciendo.

Esto sugiere un indicador de que su utilidad aún no logra superar el pudor que supone hablar con una máquina. Seguramente esto cambie en la medida que vayamos naturalizando esta experiencia al recibir a cambio un servicio de mayor utilidad. Me imagino que para personas de edad avanzada o con problemas motrices hay un potencial enorme para brindar soluciones innovadoras.

- La confusión de la desinformación que pesa sobre la vida en línea, ¿empeorará con este mundo multimedia?

- Boris Groys dice que la vida humana puede describirse como un diálogo prolongado con el mundo. El hombre interroga al mundo y es interrogado por él. Este diálogo es regulado por la forma en que definimos las preguntas válidas que dirigimos al mundo y por los modos en que podemos identificar las respuestas relevantes a esas preguntas. Si creemos que los OVNIS existen, hacemos preguntas diferentes y esperamos respuestas diferentes de las que aquellos que no lo creen.

Esto exacerba en la actualidad ya que mantenemos un diálogo con el mundo fundamentalmente a través de Internet. Si queremos dialogar con el mundo, usamos Google, Facebook o cualquier otra red social.

Sin embargo la construcción de sentido a través de Google o Facebook no depende solamente de supuestos metafísicos e ideológicos, sino además de la ocurrencia de una sentencia en un determinado contexto, tus hábitos de búsqueda y la afinidad de tu perfil con otros perfiles de características similares.

Una misma imagen e incluso un texto pueden ser interpretados de manera diferentes en contextos de usuarios diferentes. El gran desafío de las nuevas generaciones será superar el aislamiento confortable de su contexto para realizar su propia construcción de sentido.