Google anunció el martes un nuevo modo de chat de voz para su inteligencia artificial (IA) Gemini, llamado Gemini Live. Disponible en inglés para los suscriptores de Gemini Advanced, funciona de forma muy similar a la función de chat de voz de ChatGPT, con múltiples voces para elegir y la capacidad de hablar de forma conversacional, incluso hasta el punto de interrumpirla sin tocar un botón.

Google afirmó que las conversaciones con Gemini Live pueden ser "libres", por lo que podrás hacer cosas como interrumpir una respuesta a mitad de una frase o pausar la conversación y volver a ella más tarde.

Gemini Live también funcionará en segundo plano o cuando tu celular esté bloqueado. Google anunció por primera vez que Gemini Live llegaría durante su conferencia para desarrolladores I/O a principios de este año, donde también había informado que Gemini Live podría interpretar videos en tiempo real.

Google también puso a disposición de los usuarios 10 nuevas voces de Gemini, con nombres como Ursa y Dipper. La función empezó a implementarse el martes, sólo en inglés, para dispositivos con el sistema operativo Android. La compañía afirma que llegará a iOS, el sistema operativo del iPhone, y a más idiomas "en las próximas semanas".

Además de Gemini Live, Google anunció otras funciones para su asistente de inteligencia artificial, incluidas nuevas extensiones que llegarán más adelante para aplicaciones como Keep, Tasks, Utilities y YouTube Music.

Gemini también está adquiriendo conciencia del contexto de la pantalla, de manera similar a las funciones de inteligencia artificial que Apple anunció en sus conferencias WWDC de este año. Después de que los usuarios toquen "Preguntar sobre esta pantalla" o "Preguntar sobre este video", Gemini podrá brindarles información, incluida la extracción de detalles como destinos de videos de viajes para agregarlos a Google Maps.

Aplicación paga de la inteligencia artificial de Google

En la demostración realizada el martes, un ejecutivo de Google pidió a Gemini Live consejos sobre cómo crear un experimento científico con su hijo. El chatbot respondió con poca demora al brindar su respuesta y las respuestas posteriores, lo que hace que la conversación parezca más humana.

Además, Gemini Live funciona sin necesidad de usar las manos en el teléfono móvil inteligente del usuario. "Es como tener un compañero en el bolsillo con quien puedes conversar sobre nuevas ideas o practicar una conversación importante", agregó Google en la publicación del blog.

Rick Osterloh, vicepresidente sénior de dispositivos y servicios de Google, también adelantó que Gemini Live será lo suficientemente inteligente como para realizar investigaciones exhaustivas y producir informes de investigación. El informe se redactará en un documento de Google e incluirá fuentes.

El modo conversacional no será gratuito. Google lo está lanzando en inglés para aquellos que tengan una suscripción a Gemini Advanced, que cuesta 19,99 dólares por mes y ofrece acceso al modelo más poderoso de la compañía, Gemini 1.5 Pro.

Tareas prácticas con Gemini

Según Google, Gemini podrá ayudarte con tareas grandes y pequeñas al integrarse con todas las aplicaciones y herramientas de Google que usás actualmente. Y, a diferencia de otros asistentes, lo hace sin que tengas que cambiar de aplicación y servicio.

Supongamos que estás organizando una cena: podrás hacer que Gemini busque la receta de lasaña que tu madre te envió a tu Gmail y pedirle que agregue los ingredientes a tu lista de compras en Keep. Y como tus invitados son tus amigos de la escuela, podrás pedirle a Gemini que "haga una lista de reproducción de canciones que me recuerden a fines de los 70". Sin necesidad de demasiados detalles, Gemini capta la esencia de lo que querés y te lo entrega.

Con la extensión Calendario que llegará pronto, podrás tomar una foto de un volante de un concierto y preguntarle a Gemini si estás libre ese día, e incluso configurar un recordatorio para comprar entradas.

Con tu permiso, Gemini puede ayudarte a conectar tus datos personales relevantes con todo el conocimiento que Google organizó y pone a tu disposición. Por ejemplo, Gemini puede ayudarte a crear una rutina de ejercicios diaria basada en el correo electrónico de tu entrenador personal o usar tu currículum en Google Drive para escribir una biografía laboral.

Gemini puede hacer todo esto con un enfoque seguro, todo en uno, que no requiere de la transferencia a un proveedor de inteligencia artificial externo que quizás no conozcas o en el que no confíes.

Integración de Gemini en Android

Android es el primer sistema operativo móvil con un gran modelo de IA multimodal en el dispositivo (llamado Gemini Nano), por lo que tus datos, según dijo la empresa, nunca salen de tu celular para algunos de los casos de uso más sensibles.

Con Gemini Nano en el nuevo celular Pixel 9, podrás usar Call Notes para resumir el audio de una llamada telefónica o Pixel Screenshots para guardar y organizar tus imágenes. Entonces, ya sea que sus datos se procesen en la nube o en el dispositivo, residen dentro de la arquitectura Google.

Gemini es el asistente de inteligencia artificial con mayor disponibilidad: está disponible en 45 idiomas, en más de 200 países y territorios, según informó Google. Está disponible en cientos de modelos de teléfonos de docenas de fabricantes de dispositivos y se ha adaptado a los distintos formatos de Android, desde teléfonos móviles hasta dispositivos plegables.

En el Galaxy Z Fold 6 de Samsung, por ejemplo, podés llevar Gemini a una experiencia de múltiples ventanas y pantalla dividida para realizar múltiples tareas. Y en el Motorola Razr+ , podés abrir Gemini directamente desde la pantalla externa para resumir rápidamente tus correos electrónicos recientes sin tener que abrir el teléfono móvil.