Escucha a la inteligencia artificial de Google crear voces realistas

septiembre 9, 2016

Las voces creadas en computador suelen sonar artificiales.

La división de inteligencia artificial de Google, DeepMind, acaba de presentar una maquina que produce las voces humanas más realistas hasta el momento. El sistema, llamado WaveNet, genera voces con tan solo una muestra de voz humana real y crea ondas de audio basado en la muestra, según informó The Verge.

Google publicó un reporte completo y un artículo para el público, junto a muestras de audio de lo que es capaz de hacer su sustema. En todas las pruebas que escuchamos, que están en inglés y en mandarín, WaveNet demuestra que es mucho más realista que otros programas que pasan el texto a sonido, aunque aún no llega a ser completamente igual al discurso humano. Además de las voces, el sistema también puede tocar el piano.

Los programas de ‘texto a voz’ cada vez son más importante para la computación porque las personas están necesitando más de bots y asistentes personales con AI, como Siri, Cortana, Alexa y Google Assistant.

Sin embargo, cuando le haces una pregunta a Siri o Cortana, estos sistemas responden con grabaciones de una voz humana, reacomodadas y combinadas en pequeñas partes. Este método se conoce como ‘texto a voz’ concatenante. Los resultados son relativamente realistas, pero como explica Google, producir una nueva voz o tono requiere tener a un actor que grabe todos los sonidos posibles para que se guarden en una base de datos. Esta es una muestra de ese tipo de voz.

El método alternativo es el ‘texto a voz’ paramétrico, que consiste en construir voces generadas por computador. Esto se logra usando reglas codificadas basadas en la gramática o en los sonidos vocales. Las voces paramétricas no necesitan materiales base para producir voces, pero los resultados, generalmente, son robóticos y artificiales. Escucha aquí este método.

Por su parte, el sistema de Google aún está basado en una muestra inicial real, pero en lugar de recortar las grabaciones, el sistema aprende de ellas e independientemente crea sus propios sonidos en una variedad de voces. De hecho, WaveNet solo conoce los sonidos de los idiomas, no su contenido. Para construir discursos con sentido, Google moldea los resultados con reglas lingüísticas y sugerencias. Así suena:

Adicionalmente, el sistema en sí no está construido únicamente para hablar. También es capaz de otras labores, como tocar el piano. Sin embargo esto podría no sorprender, porque ya existen varios sistemas que autogeneran música y no es tan complicado como crear voces humanas. Además, la AI ya es capaz de componer música por sí misma.

Por ahora Google no tiene planeado usar WaveNet para sus productos, como Google Assistant, porque el sistema requiere una gran cantidad de energía y procesos complejos. Si quieres aprender a fondo cómo funciona este sistema puedes leer alguno de los dos reportes científicos publicados.

Imagen: Pixabay.

Susana Angulo

Antes de Internet ya me gustaban la música clásica, los animales,
cocinar postres, y leer cuentos de terror. La tecnología me ha
permitido ahondar en estas y tantas otras pasiones, que sería un error
pensar en la cultura digital como tema exclusivo de 'geeks'. Soy
periodista de la Universidad del Rosario.

View all posts

1 comment

José David dice:

septiembre 12, 2016 a las 8:21 AM

Es realmente impresionante lo cerca que está de sonar como un humano!

Escucha a la inteligencia artificial de Google crear voces realistas

Susana Angulo

1 comment

Relacionados

AliExpress ya está en la app de Claro: conozca cómo comprar directamente desde la plataforma

“Las marcas solo pagan si venden y los usuarios ganan por comprar”: María del Pilar Correa sobre la tienda virtual de Nequi

7 apps con IA que te ayudan a trabajar mejor, más rápido y con menos esfuerzo

Truecaller lanza en Colombia su “Plan Familiar”, así funciona

¿Publicidad en WhatsApp? Así funcionan y por qué ahora están apareciendo en la pestaña Novedades

¿Puedo usar Nequi fuera de Colombia? Esto es lo que sí y lo que no permite la app si estás en el exterior

Lo más leído de la semana

Microsoft lanza la actualización Windows 11, versión 24H2: disponibilidad, mejoras y cómo obtenerla

Se filtran 16 mil millones de contraseñas: datos de Google, Facebook y Apple entre los más expuestos

‘El juego del calamar’ se toma Calamar, Bolívar: así fue la grabación más macondiana del año

Triángulos y rectángulos en los semáforos, así es el nuevo diseño que verás en las calles

Xiaomi cierra junio con descuentos: últimos días para acceder a tecnología de gama alta a precios reducidos

La OEA entregará 1.200 becas de maestría en tecnología e ingeniería para colombianos: así puedes aplicar

¿Trabajas desde casa? Esto cambiará con la reforma laboral: nuevas reglas y subsidio obligatorio de conectividad

Las posibilidades para que la Generación Z ejerza estos oficios son (casi) nulas: carreras que la IA ya ha desplazado

Archivos

Escucha a la inteligencia artificial de Google crear voces realistas

Susana Angulo

You may also like

1 comment

Relacionados

Lo más leído de la semana

Archivos