Esta herramienta de inteligencia artificial de Microsoft traduce tu voz a cualquier idioma

Este desarrollo solo requiere una muestra de audio de tres segundos para entrenar este bot de inteligencia artificial de Microsoft
10/03/2023 - 09:51hs
Esta herramienta de inteligencia artificial de Microsoft traduce tu voz a cualquier idioma

VALL-E, la tecnología de texto a voz basada en inteligencia artificial de Microsoft, es capaz ahora de traducir tu voz a casi cualquier idioma que desees y su parecido con el habla humana es espectacular.

La tecnología de texto a voz basada en inteligencia artificial avanzó mucho en los últimos años, y VALL-E el modelo de Microsoft es un ejemplo de este progreso. Con su capacidad para generar un habla humana realista en una variedad de idiomas y acentos, establece un nuevo estándar para los modelos de texto a voz.

Este modelo se basa en la arquitectura Transformer, al igual que ChatGPT o Bard, que demostró ser eficaz para una variedad de tareas de procesamiento de lenguaje natural de una forma más sencilla y rápida.

Una vez entrenado, puede replicar muy bien la voz de una persona. Solo requiere una muestra de audio de tres segundos para entrenar este bot de inteligencia artificial de Microsoft.

Microsoft sumó una función a VALL-E: la capacidad de traducir tu voz a idiomas extranjeros con emociones y tonos sin notar la diferencia. En el siguiente ejemplo puedes escuchar cómo funciona:

"Proponemos un modelo de lenguaje de códec neuronal multilingüe, VALL-E X, para la síntesis de voz multilingüe. Específicamente, ampliamos VALL-E y esta novedad alivia eficazmente los problemas de acento extranjero, que pueden controlarse mediante una identificación de idioma", explicó Microsoft en un comunicado.

La inteligencia artificial es una tendencia casi omnipresente en la conversación tecnológica actual.
La inteligencia artificial es una tendencia casi omnipresente en la conversación tecnológica actual.

Inteligencia artificial: una arquitectura de software clave

La arquitectura Transformer es una red neuronal que demostró ser eficaz para tareas de procesamiento de lenguaje natural, incluida la traducción de lenguaje, el modelado de lenguaje y el resumen de texto.

Transformer también se puede adaptar a una amplia gama de tareas. Esto lo convierte en una opción buena para los modelos de procesamiento de lenguaje natural como VALL-E de Microsoft, que la utiliza para generar un habla muy realista y similar a la de un humano.

A principios de este año, el cofundador de Microsoft, Bill Gates, dijo que la inteligencia artificial es el próximo gran avance en la industria tecnológica y traerá los cambios más importantes en los próximos años. "VALL-E X puede sintetizar el habla de destino personalizada mientras mantiene la emoción en el habla de origen", explicó Microsoft.