Google podría reconocer tu voz así no estés conectado a internet

reconocimiento de voz
El software de reconocimento de voz entiende 64.000 palabras en inglés.
reconocimiento de voz
El software de reconocimento de voz entiende 64.000 palabras en inglés.

Si usas el reconocimiento de voz en tu teléfono inteligente, seguro sabrás que no funciona si no estás conectado a internet. Esto es así porque el procesamiento de las señales de voz no ocurre en el teléfono, sino en servidores remotos: hacerlo localmente gastaría mucha energía, memoria y recursos de procesamiento en un smartphone.

Sin embargo, un equipo de ingenieros de Google dio a conocer este martes un artículo académico en el que explican cómo lograron correr un programa de reconocimiento de voz que se ejecuta localmente en un Nexus 5, como informó ZDNet.

Según el documento, el software logra procesar comandos de voz siete veces más rápido que en tiempo real en humanos, con una tasa de errores del 13,5%  y una ‘huella’ en la RAM del dispositivo de solo 20,3 MB, una medida muy inferior a la que consumen muchas de las apps más populares.

La mayoría de aplicaciones consumen más RAM

Esto fue posible gracias a que se implementaron algoritmos de inteligencia artificial en el código de la aplicación de reconocimiento de voz, que le permitieron aprender a predecir lo que decía el usuario y así no procesar la totalidad de los sonidos. También usaron algoritmos de compresión para reducir el ‘peso’ de los archivos de audio, y añadieron al modelo la información local del teléfono, como la agenda de contactos o el calendario, para hacer posible que se le pudiera dar órdenes al dispositivo por medio de comandos de voz.

Para entrenar el algoritmo, Google usó 2.000 horas de tráfico de voz anónimo de Google hecho por usuarios reales, y tomó patrones de ruido tomados de videos de YouTube. El software tiene un vocabulario de 64.000 palabras.

Esto último es crucial. Servicios como Google Now dependen del procesamiento de voz, y tecnologías como esta hacen posible y viable utilizarlo sin conexión. En lugares donde las redes de datos son muy costosas o no muy confiables, un software como este puede ayudar a mejorar la experiencia con teléfonos inteligentes, especialmente a personas con discapacidad.

Este es solo uno más entre los avances en inteligencia artificial logrados por Google recientemente. En campos que van desde el reconocimiento de imágenes hasta el juego de Go, la empresa californiana está invirtiendo bastante y consiguiendo resultados notables en algoritmos. Algunos de ellos tienen un destino claro en productos de la compañía, como Google Photos, y otros solo nos dan pistas de lo que la empresa está pensando para el futuro.

Imagen: Howard Dickins (vía Flickr)

José Luis Peñarredonda

José Luis Peñarredonda

Un día me preguntaron sobre mis intereses y no supe por dónde empezar. Decidí entonces ponerlos en orden y dibujé un diagrama de Venn para agruparlos a todos: Internet, cine, periodismo, literatura, narración, música, ciencia, fotografía, diseño, política, escritura, filosofía, creatividad... Me di cuenta de que en toda la mitad de ese diagrama, en el punto en el que todos estos círculos confluyen, está la tecnología. Eso me llevó a ENTER.CO. Estudié Periodismo y Filosofía en la U. del Rosario. PGP: http://bit.ly/1Us3JoT

View all posts

Archivos