Meta lanzó modelo IA multilingüe entrenado con la Biblia que identifica 4 mil idiomas

Meta Biblia

Meta lanzó un código de un nuevo modelo de inteligencia artificial que puede identificar más de 4.000 idiomas hablados; según Mark Zuckerberg esto facilitaría no solo conectarse, sino que las personas podrían acceder a cualquier información en su idioma. La IA fue entrenada con textos religiosos como la Biblia.

El modelo presentado por Meta fue nombrado como ‘IA de voz masivamente multilingüe’, esta nueva herramienta no solo puede identificar este sinnúmero de idiomas hablados, sino que lo que hace “40 veces más que cualquier tecnología anterior conocida”.

Además, explica que los modelos “amplían la tecnología de texto a voz y de voz a texto de alrededor de 100 idiomas a más de 1100”.

El modelo podría implementarse en aplicaciones, por ejemplo, de realidad virtual y realidad aumentada en el idioma preferido de una persona para que  pueda enterder culaquier información.

¿Cómo logro Meta este desarrollo multilingüe?

La compañía de Zuckerberg explica que recurrieron a textos religiosos, como la Biblia, que se han traducido en muchos idiomas diferentes y cuyas traducciones se han estudiado ampliamente para la investigación de traducción de idiomas basada en texto.

Esto, según el magnate, porque los conjuntos de datos de voz más grandes que existen hoy en día solo llegan hasta 100 idiomas.

“Estas traducciones tienen grabaciones de audio disponibles públicamente de personas que leen estos textos en diferentes idiomas. Como parte del proyecto ‘IA de voz masivamente multilingüe’, creamos un conjunto de datos de lecturas del Nuevo Testamento en más de 1100 idiomas, que proporcionó un promedio de 32 horas de datos por idioma”, explica Meta.

Te puede interesar: Meta revela avances de su supercomputadora IA y chip de silicio con mayor potencia de cómputo

Así mismo, señaló que desarrollaron otras lecturas religiosas como las cristianas para aumentar el número de idiomas disponibles a más de 4000. “Si bien estos datos son de un dominio específico y, a menudo, los leen hablantes masculinos, nuestro análisis muestra que nuestros modelos funcionan igualmente bien para voces masculinas y femeninas . Y aunque el contenido de las grabaciones de audio es religioso, nuestro análisis muestra que esto no sesga el modelo para producir un lenguaje más religioso”, puntualiza.

Por último, lo que pretende Meta es que ‘IA de voz masivamente multilingüe’ admita más idioma y tenga más cobertura, además, de incluir dialectos.

Imagen: Montaje ENTER.CO

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos