• 10/12/2024

¿Cómo son los dispositivos con inteligencia artificial que convierten información visual en audio?

iProfesional probó los dispositivos de asistencia OrCam MyEye 2.0 y OrCam Read, enfocados a personas con discapacidad visual o problemas de lectura
13/06/2022 - 12:41hs
¿Cómo son los dispositivos con inteligencia artificial que convierten información visual en audio?

OrCam Technologies es una empresa israelí especializada en aplicaciones de inteligencia artificial para personas, fundada en 2010 por Amnon Shashua y Ziv Aviram, quienes también son cofundadores de Mobileye, una compañía de Intel famosa por su sistema anticolisión e innovador en conducción autónoma.

Inspirado en el desarrollo de tecnología de visión artificial innovadora que permite una conducción más segura, OrCam aprovecha la visión computarizada impulsada por inteligencia artificial para proporcionar una mayor independencia a las personas ciegas o con discapacidad visual, con problemas de audición, dificultades de lectura y otras personas.

iProfesional tuvo la oportunidad, a través de la compañía argentina Internacional Óptica, de probar el dispositivo insignia en tecnología de asistencia OrCam MyEye 2.0, y otro de sus dispositivos, OrCam Read, enfocado a personas con dislexia, afasia y dificultades de lectura.

Ambos equipos fueron anunciados a nivel global en publicidades para las cuales se contrató al futbolista argentino Lionel Messi.

OrCam MyEye 2.0: descripción

Consta de una pieza de hardware con una cámara en un extremo y un altavoz cerca del otro extremo. El dispositivo se monta en el marco de cualquier par de anteojos a través de un soporte magnético. La caja contiene varios soportes para que puedas usar OrCam en más de un par de anteojos si lo deseás.

La parte inferior del dispositivo OrCam es plana y tiene un botón de encendido cerca del altavoz. El lado superior del dispositivo es redondeado y tiene una barra táctil que se levanta para facilitar su ubicación.

La barra hace clic cuando se presiona, por lo que es fácil saber cuándo se ha realizado una acción. Dicho esto, el tamaño pequeño del dispositivo junto con el uso de una barra táctil puede presentar un desafío para cualquiera que tenga problemas de destreza. Es posible ajustar la sensibilidad de la barra táctil.

Configuración de OrCam MyEye 2.0

OrCam MyEye 2.0 no permite que una persona ciega vea en forma física su entorno. Es una cámara que toma fotos e informa la retroalimentación a través de un motor de texto a voz que se podía escuchar fácilmente a través de su altavoz, que está muy cerca del oído derecho, en el caso de las pruebas que hizo iProfesional.

Durante la prueba de OrCam, se eligió usar la voz femenina que es la predeterminada, con una velocidad de habla establecida en 220 palabras por minuto. OrCam habla muchos idiomas.

OrCam MyEye 2.0 tiene tantas configuraciones que no es posible cubrirlas todas en esta nota. Sin embargo, hay algunas cosas que vale la pena señalar. Primero, para acceder al menú Configuración, debés presionar rápidamente el botón de Encendido mientras deslizás el dedo por la barra táctil.

Aunque se encontró esto factible, definitivamente fue complicado a veces. A menudo el usuario se encuentra colocando la unidad en modo de suspensión, lo que se logra simplemente presionando el botón de Encendido.

Orcam MyEye 2.0 se monta en el anteojo del usuario.
Orcam MyEye 2.0 se monta en el anteojo del usuario.

Otra pulsación del botón antes de que la unidad se suspenda la apagará, y se tiene la frustración de hacerlo en más de una ocasión. Sin embargo, una vez en el modo de configuración, se mueve a través de varias configuraciones deslizando la barra táctil para pasar de una opción a otra y tocando la barra táctil para hacer una selección.

Debido al pequeño tamaño de OrCam MyEye 2.0, se descubre que, en lugar de usar la unidad, lo mejor era sostenerla en la mano. Además, se necesitaba tener mucho cuidado al deslizar y tocar la barra táctil para evitar tomar decisiones que no se querían por accidente.

La estructura del menú y las indicaciones de voz son muy intuitivas, y nunca hubo problemas para descubrir cómo hacer cambios en los ajustes de configuración de OrCam MyEye 2.0.

Requisitos de luz para OrCam MyEye 2.0

Ya sea que estés leyendo un menú en un restaurante, aprendiendo una cara para reconocerla en el futuro o leyendo el boletín de una organización, OrCam MyEye 2.0 requiere mucha luz. Afortunadamente, OrCam MyEye 2.0 te avisará cuando no haya suficiente luz disponible para tareas como el aprendizaje de rostros.

Otras tareas, como reconocer un billete en mi mano, resultaron algo menos claras. Si se tienen dificultades para realizar una tarea, siempre debe buscarse más luz antes de hacer cualquier otra cosa.

Orcam MyEye 2.0 es muy liviano.
Orcam MyEye 2.0 es muy liviano.

Duración de la batería en OrCam MyEye 2.0

Necesitarás recargar después de solo un par de horas de uso, algo que dificulta integrar realmente OrCam My Eye 2.0 en un flujo de trabajo diario. Solo toma media hora recargar la batería, y es posible usar la unidad mientras está conectada a un pequeño cargador de batería externo.

Sería preferible tener una pieza de hardware dedicada que contenga una batería más grande y quizás algunos controles más fáciles de usar en lugar de una unidad autónoma con poca duración de la batería. OrCam My Eye 2.0 utiliza un cargador micro USB estándar, lo que facilita la recarga desde cualquier lugar.

Cámara del Orcam MyEye 2.0.
Cámara del Orcam MyEye 2.0.

Lectura con OrCam MyEye 2.0

Para comenzar a leer de una hoja de papel, simplemente sostenéla frente a vos, tocá la barra táctil y dejá que OrCam MyEye 2.0 tome una foto y comience a leer.

También es posible señalar una hoja de papel con el dedo hacia arriba. OrCam ve tu uña y tomá una foto tan pronto como retirás el dedo. Esto te permite seleccionar varios puntos en un documento y comenzar a leer desde ese punto.

A veces, OrCam MyEye 2.0 anuncia que hay texto ilegible y continúa leyendo después de ese punto. En otras ocasiones, OrCam MyEye 2.0 te dirá que hay más texto debajo de donde deja de leer, pero que no puede leer ese texto. Luego debe tomar otra foto más abajo en la página.

Finalmente, podés decirle a OrCam que comience automáticamente a leer una página si ve tres o cuatro lados de esa página. Usando gestos con las manos o la barra táctil, es posible detener la lectura, pausar la lectura o avanzar y retroceder a través del texto.

Reconocimiento facial con OrCam MyEye 2.0

Quizás una de las características más fascinantes de OrCam MyEye 2.0 es el reconocimiento facial. Si lo deseás, puede hacer que OrCam MyEye 2.0 te diga cada vez que vea una cara si conocés a esa persona o no.

Es posible hacer que OrCam MyEye 2.0 solo reconozca caras conocidas, que es la configuración predeterminada lista para usar. Es fácil hacer que OrCam MyEye 2.0 identifique el hecho de que una cara está frente a la cámara simplemente tocando la barra táctil.

Para aprender una cara, mantené presionada la barra táctil mientras el sujeto de interés gira la cara lentamente en una dirección y luego en la otra. Incluso se recomienda que la persona hable durante este proceso.

Orcam MyEye 2.0 tiene varios tipos de conexiones.
Orcam MyEye 2.0 tiene varios tipos de conexiones.

OrCam MyEye 2.0 toma una serie de fotografías de hasta 30 segundos. A continuación, tenés la oportunidad de grabar el nombre de la persona. Puede almacenar hasta 100 caras en la base de datos de OrCam MyEye 2.0. No podés descargar imágenes de las redes sociales, ni el software puede reconocer rostros de una fotografía.

OrCam MyEye 2.0 necesita tomar las fotografías para poder identificar adecuadamente la cara en el futuro. Es posible modificar o eliminar cualquiera o todas las caras en la base de datos.

OrCam MyEye 2.0: otras funciones

Para leer bloques cortos de texto, funcionó muy bien. Los menús en los restaurantes presentaban un desafío porque contienen mucho texto y los restaurantes a menudo son ruidosos y tienen poca luz.

Si bien es posible realizar tareas como identificar dinero y leer códigos de barras con OrCam, las aplicaciones de bajo costo o incluso gratuitas para un teléfono inteligente realizan estas mismas tareas de manera muy eficiente.

OrCam Read: descripción

Este producto viene con la afirmación de poder brindar asistencia a las personas con discapacidad visual de leve a moderada o problemas específicos de lectura.

El equipo está compuesto por el dispositivo OrCam Read, el cable USB de tipo A a tipo C, el adaptador de alimentación de 3 pines, los auriculares con cable, el cordón, el paño de limpieza y la guía del usuario en diez idiomas diferentes.

Tiene la apariencia de una memoria USB que ha pasado por un tratamiento con esteroides. Es lo suficientemente portátil como para caber fácilmente en un bolsillo o bolso sin causar un bulto o un peso si querés llevarlo al cuello usando el cordón.

OrCam Read parece a primera vista una memoria USB.
OrCam Read parece a primera vista una memoria USB.

Decorado en negro mate con logotipos plateados decorativos, el OrCam Read organiza sus controles a lo largo de la parte superior del dispositivo. Estos controles, que se ejecutan de adelante hacia atrás, consisten en un botón de disparo circular, botones de ajuste de volumen más y menos y un mini botón de encendido alargado.

Sostenido en cualquier mano como si fuera un bolígrafo, los distintos controles son fácilmente accesibles. También decorando la parte superior del dispositivo hay una fila de luces LED indicadoras de encendido y una toma USB tipo C para fines de carga.

Situada en la parte frontal del dispositivo hay una combinación de características de cámara y láser. Con el láser actuando como medio para seleccionar el texto, la cámara capturará el contenido que luego se volverá a leer al usuario.

OrCam Read: modos disponibles

OrCam Read ofrece al usuario dos modos diferentes para la selección del texto. Estos modos se denominan Marco y Puntero. Como su título lo indica, el modo Cuadro apunta a un área particular encerrada dentro de un cuadro generado por láser.

El área objetivo se puede aumentar o reducir acercando o alejando la OrCam Read del texto. Una vez que la cámara haya tomado una imagen del texto, se leerá con una voz masculina o femenina.

El modo de puntero permite seleccionar un punto preciso desde el cual puede comenzar la lectura. En el modo, se notó que el ángulo entre el posicionamiento del documento y OrCam Read podría causar cierta confusión sobre dónde debería comenzar la lectura.

Cámara del OrCam Read.
Cámara del OrCam Read.

Descubrí que se podían lograr los resultados más precisos si el documento se colocaba plano o se sostenía en posición vertical con el OrCam Read colocado directamente sobre la cabeza o en un ángulo de 90 grados frente al documento.

Cuando se trata de un documento grande, como un periódico, es posible que necesités OrCam Read para tratar con información específica o un tipo de texto. Para ayudar a lidiar con este tipo de tareas, OrCam Read tiene un modo de lectura inteligente.

Con esta función, podés dirigir la función de lectura hacia áreas específicas del documento mediante comandos de voz. De esta forma, podés orientar los títulos, las cantidades utilizando monedas como dólares, euros, libras y yenes o concentrarse en artículos específicos o parte del documento.

OrCam Read: comandos de voz

Los comandos de voz de OrCam Read también se pueden utilizar para acceder a diversos problemas de "ayuda" y comandos de configuración, como la opción de voz masculina o femenina con un volumen ajustable y el número de palabras que se leerán por minuto.

Si bien se pueden escuchar los diversos anuncios de OrCam Read y el contenido que se lee, usando cualquiera de las voces, es posible mejorar la salida del volumen de audio configurando un enlace a un altavoz Bluetooth externo y usando auriculares. Las instrucciones sobre cómo realizar esta tarea se enumeran en la Guía del usuario del producto.

OrCam Read: sólo para iOS

Es casi obligatorio que los dispositivos hoy tengan una aplicación que los acompañe. OrCam Read no defrauda en este aspecto pero no satisface totalmente a todo el mundo.

Hay una aplicación, pero solo para aquellos con un iPhone o iPad. Los fanáticos de Android no tienen suerte y tendrán que usar el producto OrCam Read sin la ayuda de una aplicación.

OrCam Read se puede llevar a modo de collar.
OrCam Read se puede llevar a modo de collar.

Precios y público objetivo de los productos OrCam

Internacional Óptica representa en la Argentina a este fabricante israelí. Orcam MyEye 2.0 tiene un valor de u$s4.290 (no incluye IVA 21%) al cambio oficial. Es adecuado para todas las afecciones oculares y todos los niveles de pérdida de visión, así como para personas con fatiga y dificultades para leer.

No mejora la visión de las personas. Personas con discapacidad auditiva no podrían beneficiarse del dispositivo. También requiere que el usuario controle totalmente los movimientos de la cabeza y las manos.

OrCam Read tiene un valor de u$s3190 (no incluye IVA 10.5%) al cambio oficial. Asiste a personas que tienen cierto nivel de discapacidad o dificultad en la lectura como por ejemplo la dislexia y la fatiga.

Personas que tengan niveles moderados a severos de discapacidad visual o no tengan control total sobre los movimientos de sus manos tendrían dificultades para usar el dispositivo.

OrCam Read requiere también que el usuario pueda oír, con o sin audífonos. Puede ayudar a cualquier persona que lea grandes cantidades de texto a diario, incluidos estudiantes, profesionales, etc.

Temas relacionados