Así es la inteligencia artificial en favor de los ciegos

La inteligencia artificial llegó para quedarse. Últimamente hemos visto diferentes intentos de desarrollo de esta tecnología y probablemente esta se vuelva mucho más ‘normal’ en nuestro día a día. La inteligencia artificial no es solamente un robot físico que aprenda y sus aplicaciones van más allá de ganarle al campeón mundial de Go ni mucho menos un robot loco que responde mensajes incoherentes en las redes sociales. Por ejemplo, en menos de dos semanas hemos visto dos aplicaciones de la inteligencia artificial que ayudarán a la inclusión de personas con discapacidad visual, y que podríamos utilizar ya mismo.

Facebook para ciegos

Facebook recién mostró su ‘automatic alternative text’ con el que pretende explicar las fotografías por medio de comandos de voz. Esta funcionalidad fue desarrollada por el equipo de accesibilidad de la compañía, el cual ha lanzado otras soluciones como los subtítulos a los videos y la posibilidad de aumentar el tamaño de letra en Facebook para iOS.

Esta vez, ‘automatic alternative text’, que llega a iOS y próximamente llegará a Android y la versión web, reconoce los objetos en las fotos, de manera similar a como funciona la búsqueda y clasificación de Google Fotos. Esto se da por medio de métodos de aprendizaje automático, donde se reconocen patrones y se usan algoritmos para establecer predicciones. Así, Facebook para iOS hace uso del VoiceOver del dispositivo para leer una descripción de la imagen al usuario.

Por ahora esta tecnología se limita a dar descripciones básicas, como informa The Verge, de medios de transporte (cosas como carro, barco, avión), naturaleza (nieve, mar, océano, atardecer), deportes, comida, personas e incluso identificar si es una selfie.

Esta tecnología es importante porque una de las expresiones más importantes de la era actual es la posibilidad de comunicarnos por medio de imágenes y videos. Por algo aplicaciones como Snapchat son tan populares y siguen ganando usuarios que publican y ven contenidos multimedia durante un buen tiempo cada día.

Esto es impensable para una persona con discapacidad visual. La posibilidad de disfrutar una fotografía a través de un teléfono móvil es nula actualmente. De hecho, Twitter recientemente implementó la posibilidad de añadir descripciones a las imágenes, que pueden ser leídas por los sistemas de reconocimiento de los smartphones, pero estas descripciones escritas por humanos no siempre están pensadas para que las entienda alguien que no puede ver la imagen.

Microsoft y su inteligencia artificial para mostrar el mundo

La semana pasada, durante la conferencia para desarrolladores de Microsoft Build 2016, vimos el caso de un ingeniero de Microsoft, quien es ciego, utilizando unas gafas que le describían lo que pasaba frente a él, como podemos ver en el siguiente video.

De esta forma, a través de las gafas con cámara integrada Pivothead y la aplicación Seeing AI de Microsoft es posible ver el mundo a través de descripciones. En ciertos momentos, cuando se tiene una conversación con otras personas, hay muchos elementos de comunicación no verbal que alguien que no ve no puede percibir, así que este proyecto le ayuda a conocer un poco más lo que sucede a su alrededor.

Seeing AI ha sido diseñada con base al Project Oxford de Microsoft, enfocado en el reconocimiento de imágenes y personas. En el pasado hemos visto que la compañía de Redmond ha utilizado sus desarrollos para probar si puede calcular la edad de alguien a través de una foto o adivinar la raza de un perro. Incluso esta tecnología ha servido para desarrollar el despertador Mimicker, que te pone pruebas como hacer caras o mostrarle algo de determinado color, para que te pares de la cama y comiences tu día.

Para terminar, es interesante todo lo que se viene en el futuro para la inteligencia artificial. En especial porque estos desarrollos podrán estar al alcance de una gran cantidad de personas por un bajo costo.

Imagen: Olga PRaktika (vía Shutterstock).

Enrique Cuartas

Enrique Cuartas

Mi vida gira en torno a la búsqueda: buscas información, buscas música que te gusta, buscas nuevos destinos para conocer, buscas tomar la mejor foto. Administrador de Empresas, bailarín de tango en mi tiempo libre, viajero empedernido, me encantan los idiomas y la tecnología móvil. ENTER.CO es ahora mi plataforma de búsqueda. Escribí para Hipertextual en el extinto blog Celularis y he blogueado a nivel personal en los últimos años.

View all posts

Archivos