VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

enero 10, 2023

Microsoft ha creado una herramienta que con solo escuchar un audio de 3 segundos de tu voz , es capaz de hablar como tú, replicando la misma emoción del interlocutor. VALL-E también es capaz de imitar el ruido ambiental.

VALL-E ha sido desarrollada por un equipo de investigadores de Microsoft, basándose en la inteligencia artificial capaz de sintetizar cualquier tipo de voz escuchando un audio de 3 segundos. También puede entonar casi la misma emoción del interlocutor e imitar el sonido ambiente.

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

La apuesta es fuerte en este 2023 por parte de Microsoft, con herramientas de IA como ChatGPT, la cual añadirá al buscador Bing antes de abril para competir con el gigante de las búsquedas, Google.

Entre tanto, el nuevo modelo de IA de texto a voz es capaz de analizar una voz específica, la intención del interlocutor y sintetizar el audio para decir cualquier cosa que se te ocurra.

Recordemos que FakeYou es una herramienta similar que se hizo famosa en internet a mitad del año pasado, por imitar con éxito diferentes voces de personalidades célebres o personajes de ciencia ficción.

VALL-E marca ahora la diferencia, utilizando un modelo de lenguaje de códec natural. Similar al que Meta desplegó en octubre de 2022, mediante un tipo de tecnología conocida como EnCodec.

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Microsoft también ha utilizado una biblioteca de audio llamada LibriLight, que ha sido desarrollada por Meta, aunque contiene mayormente conversaciones de habla inglesa de más de 7.000 personas de la plataforma LibriVox.

El objetivo es aprovechar esta IA para lograr una mejor calidad en las herramientas para pasar de voz a texto, en aplicaciones como WhatsApp, por ejemplo. Sin embargo, también lanzan una advertencia ante el uso indebido de este tipo de tecnologías.

“Dado que VALL-E podría sintetizar el habla que mantiene la identidad del hablante, puede conllevar riesgos potenciales en el uso indebido del modelo, como falsificar la identificación de voz o hacerse pasar por un hablante específico. Para mitigar tales riesgos, es posible construir un modelo de detección para observar si un clip de audio ha sido sintetizado por VALL-E. También pondremos en práctica los principios de IA de Microsoft cuando desarrollemos más los modelos”, especifican los investigadores.

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Microsoft no ha anunciado el uso de este modelo en alguno de sus productos o si solo corresponde a otro importante avance de la inteligencia artificial para 2023. Actualmente, VALL-E contiene ejemplos en castellano.

Imagen: Pixaby

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Digna Irene Urrea

Relacionados

Android estrena función contra llamadas falsas: así puedes activarla y evitar estafas con IA

Spotify lanza Clips de Podcasts: ahora podrás guardar y compartir momentos específicos de episodios

Spotify ahora te permite escuchar artículos de revista

inDrive y Hunter quieren que tus viajes sean más seguros: así funcionará la alianza en Colombia

Lank: la plataforma legal para pagar menos por Netflix, Spotify y hasta ChatGPT

Google quiere reemplazar las búsquedas tradicionales con agentes de IA

Lo más leído de la semana

Honor WIN Turbo oficial: batería de 10.000 mAh y pantalla de 6,79 pulgadas

¿Cómo usar los cupones de Uber para ir a votar gratis o pagar menos en las elecciones?

Xiaomi 17T llega a Colombia: así son los nuevos celulares con zoom Leica y baterías de hasta 7000 mAh

Xiaomi 17T vs Xiaomi 17T Pro: diferencias, batería y qué usuario debería elegir cada uno

HONOR Magic8 Lite vs realme C100 ¿Cuál resiste más?

Nuevo ranking mundial de celulares: estos fueron los 10 smartphones más vendidos de 2026

iPhone Ultra plegable: fundas revelan su diseño y módulo de cámaras

Samsung Galaxy S27 Ultra tendría cámara de 200 MP, batería gigante y nuevo diseño horizontal

Archivos

VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Digna Irene Urrea

You may also like

Relacionados

Lo más leído de la semana

Archivos