Llega la búsqueda de Google por voz con acento latinoamericano

Hasta ahora, Google Voice Search era solo una innovación lejana para los usuarios de teléfonos inteligentes en la región. Ahora sí reconoce los términos, expresiones y acentos de argentinos, mexicanos, chilenos, colombianos y demás habitantes de Latinoamérica.

Google Voice Search, la herramienta de búsqueda por voz para dispositivos móviles que llegó al español de España en agosto de 2010, ahora está en Latinoamérica con todas las de la ley, pues comprende y respeta los acentos y términos locales de diferentes países de la región.

Aunque no se trata de una herramienta considerada como imprescindible, en la medida en que funciona mejor, se vuelve muy útil para los usuarios más intensos de Internet y dispositivos móviles, pues permite hacer búsquedas más rápidas y en circunstancias que no permiten la digitación de texto.

Tras muchos meses de trabajo de investigadores, lingüistas e ingenieros, y la ejecución de software en miles de computadores cada día usando la infraestructura de computación en la nube, Google logró que su servicio de búsqueda por voz (BxV) fuera capaz de identificar el lenguaje propio de Argentina, México y otros cinco países países: Colombia, Chile, Perú, Panamá y Costa Rica.

La labor representó un reto mayor para Google y una inversión tecnológica importante: aunque el idioma es menos complejo que otros en cuanto al reconocimiento de la pronunciación de las palabras en general, desarrollar una herramienta para cada país o grupo de países obligó casi que a comenzar de ceros con cada uno, debido a las particularidades tanto del acento como del vocabulario y los modismos en cada lugar. Hoy, además de la búsqueda por voz para el español de España, están disponibles las de Argentina, México y el resto de América Latina, centrado en los 5 países mencionados (habría sido ideal una versión independiente para cada nación, pero dadas las exigencias en el desarrollo y los buenos resultados que esta versión del resto de la región, al parecer esto no se consideró necesario.

La tecnología de búsqueda por voz de Google se basa en 3 fuentes de información: acústica, léxica y lingüística. En cuanto a la fuente acústica, indica cómo se vocaliza cada sonido; para cada país, Google recogió cientos de miles de frases habladas, pronunciadas por personas nativas en diferentes ciudades (Bogotá, Cartagena, Santiago, Buenos Aires, Lima…), con distintos acentos, edades y entornos acústicos como casas, oficinas, restaurantes, calles o automóviles en movimiento, con el fin de entrenar el modelo de reconocimiento de voz para la búsqueda en la vida real.

La fuente léxica se enfoca en la pronunciación de palabras y expresiones que combinan letras, números y otros elementos. Por ejemplo, ¿cómo se pronuncia www.7up.com.ar? (Algunas posibilidades son ‘uve doble uve doble uve doble, o triple ve, o doble u doble u doble u; siete up, seven up…). Lo mismo ocurre con términos extranjeros como nombres de ciudades o calles, que no tienen pronunciaciones estándar. Los sistemas de BxV reconocen más de un millón de palabras, pero esta cifra crecerá constantemente.

En cuanto a la fuente lingüística, una alternativa para Google era procesar páginas de texto, pero se prefirió procesar billones de búsquedas hechas por los latinoamericanos en Google.com.ar, Google.com.mx, Google.com.co, Google.com.pa, Google.com.cl, Google.com.pe y Google.co.cr. Pedro Moreno, científico de investigación en Google, afirmó durante una videoconferencia para los medios latinoamericanos que «una de las características de la herramienta es que aprende de los usuarios».

Solo para Android y iPhone.

La buena noticia de un Google Voice Search con sabor latinoamericano es parcial: por lo pronto, solo funciona en dispositivos móviles con la plataforma Android (también de Google) y con el iPhone, por lo que están excluidas Google Voice para BlackBerry y teléfonos de Nokia con Symbian S60.

Para hacer la búsqueda por voz en los teléfonos con Android 2.2 (Froyo), 2.3 (Gingerbread) o próximas versiones, en la caja de búsqueda se puede ver un micrófono, el cual con un toque se activa y captura la voz del usuario. En teléfonos con versiones antiguas (como la 1.6 o la 2.1), es necesario ir al Android Market e instalar la aplicación gratuita Búsqueda por voz.

En el iPhone, se debe instalar desde la App Store la aplicación gratuita Google Mobile, que incluye varias aplicaciones de Google (Gmail, Docs, Calendar, Buzz, Reader, Noticias, Traductor, Maps y YouTube), además de la búsqueda. Para buscar, se pueden escribir los términos de búsqueda en el teclado virtual, utilizar el ícono del micrófono de la búsqueda por voz, o el de la cámara para la herramienta Goggles.

Además, en Android la búsqueda por voz va más allá: se integra a Google Maps, por lo que encontrar lugares públicos o direcciones desde el dispositivo móvil es aún más fácil, y a Google Translate, gracias a lo cual el dispositivo móvil se convierte en un traductor simultáneo perfecto para viajeros.

En todos los casos, es necesario configurar el idioma deseado desde las aplicaciones de Google. Los hispanoparlantes ahora podemos escoger entre las versiones para España, México, Argentina y el resto de América Latina.

Adicionalmente, aunque la herramienta está pensada para dispositivos móviles, existe una API para la Web, que podría abrir un nuevo campo a los desarrolladores para encontrar nuevos usos a la búsqueda por voz.

Primeras pruebas.

Durante la conferencia de prensa que dieron en simultánea Pedro Moreno, desde España, y Ricardo Blanco, gerente de comunicación de productos para Latinoamérica, desde México, se mostraron ejemplos de cómo Google Voice Search acierta en búsquedas de términos complejos y muy locales, como lugares mexicanos cuya pronunciación es difícil para cualquiera. Según ellos, la herramienta acierta en alrededor de un 75% de los casos, pero entre más usuarios consiga, aprenderá más y aumentará esta tasa de aciertos.

Dado que no hay un Google Voice Search para Colombia, en nuestras primeras pruebas hicimos algunos ejercicios no muy convencidos de obtener los excelentes resultados de los ejemplos vistos con expresiones mexicanas y argentinas (como las de los videos que presentamos al final). Estos fueron los resultados:

  • Caparrapí: al pronunciar el nombre de este municipio colombiano con la búsqueda de España, Argentina y México, Google buscó ‘skaparapid’, mientras que con la de América Latina buscó, efectivamente, ‘Caparrapí’.
  • Ajiaco: este delicioso plato local es conocido internacionalmente, y probablemente por eso la búsqueda acertó en las 4 versiones del español (aunque para España la pronunciación debió ser muy clara, para que no cometiera el error de buscar ‘Asia Cup’).
  • Rafa Robayo: tratamos de agregar un nivel de dificultad mayor al buscar el volante de Millonarios, cuyo nombre de pila es Rafael. Configurado con Argentina, Google Voice Search buscó ‘Rafa Rovatti’, ‘Rafa rowa you’ y ‘Rafa Rubatto’. Con España, buscó ‘Rafa rubayo’ pero el propio buscador sugirió la búsqueda correcta, mientras que con México y América Latina comprendió lo que quería encontrarse.
  • En las búsquedas por voz de palabras genéricas o incluso de expresiones locales de los países (como el chilenismo ‘cachai’ y el mexicanismo ‘no manches’), la herramienta acertó con las 4 versiones del español.

Conclusión: hasta ahora, para los latinoamericanos Google Voice era solo un elemento curioso dentro de la aplicación de búsqueda de Google en los dispositivos móviles. Ahora puede convertirse en una herramienta realmente útil, tanto para el día a día como, probablemente aún más, durante los viajes.

Para terminar, Pedro Moreno no reveló cifras globales de uso de Google Voice Search, aunque adelantó que millones de personas ya la utilizan constantemente. «En Latinoamérica esperamos que también sean muchos usuarios, aunque sabemos que esto no depende solo de la herramienta, sino de la penetración de los smartphones y de los planes de datos, que en algunos países todavía son costosos y frenan el uso de estas innovaciones», afirmó. Sin embargo, esto no es una preocupación para Google, al menos por ahora: «No nos importa si al principio solo lo usan miles de personas, pero sabemos que en algún momento el crecimiento es plano y luego se vuelve exponencial». Lo cierto es que a Google le interesa que más personas empleen la herramienta para que esta pueda aprender de los usuarios y mantenga una constante evolución.

¿Debería Google crear versiones para más países, y cuáles serían los candidatos? ¿Y para BlackBerry, webOS, Symbian y Windows Phone 7? ¿Para alguno de ustedes Google Voice Search se convertirá en herramienta de uso diario, o será útil solo para impresionar a otras personas, como suele ocurrir con Goggles? Ustedes tienen la palabra –por ahora, escrita–.

Mauricio Jaramillo Marín

Mauricio Jaramillo Marín

En los últimos 14 años he cubierto y vivido las transformaciones que la tecnología e Internet han traído a nuestra vida cotidiana y a campos tan importantes como la educación, la cultura, el entretenimiento, la salud, la economía y la productividad empresarial. La tecnología, pues, ya cambió el mundo, y lo seguirá haciendo. Pero depende de nosotros –los periodistas y difusores de esta información, así como los usuarios intermedios y avanzados– que nuestras sociedades la aprovechen al máximo.
Por eso, soy un apasionado de la tecnología, de probar software, hardware y servicios web, pero también de ayudar a que más personas le saquen provecho, ya sea dando talleres por Latinoamérica sobre Internet o tecnología aplicada en diferentes campos, o generando contenidos que aporten a un mejor entendimiento de estos temas.
Todo esto hace que me ilusione ENTER.CO: porque lo veo como un canal no solo para informar y entretener, sino también para educar y motivar a más colombianos y latinoamericanos a que se interesen y aprovechen mejor las herramientas que ya tienen a su alcance, y así, para que estas realmente les ayuden a mejorar sus vidas.

Ver todos los posts

Archivos