Gemini ya transcribe audios sin costo y así puedes usarla

Desde el 8 de septiembre de 2025, Gemini permite subir archivos de audio para transcribir, resumir o analizar contenido directamente desde el chat. Disponible en la versión web y en las aplicaciones móviles, esta función responde a una de las solicitudes más reiteradas por los usuarios, según confirmó el equipo de Google Labs.

Utilizarla es sencillo. Solo hay que iniciar una conversación, pulsar el ícono “+”, seleccionar el archivo de audio y añadir una instrucción como “Transcribe esto” o “Resume lo esencial”. En pocos segundos, Gemini convierte la grabación en texto o en un resumen estructurado. Los formatos compatibles incluyen MP3, M4A, FLAC y WAV, entre otros estándares.

El alcance de esta función varía según el plan. La versión gratuita permite analizar audios de hasta 10 minutos por solicitud. Los usuarios de Gemini Advanced, incluido en Google One AI Premium, pueden subir grabaciones de hasta tres horas. En todos los casos se pueden adjuntar hasta 10 archivos por prompt, incluyendo archivos comprimidos en ZIP.

Te puede interesar: Google presenta ‘Nano Banana’ en Gemini: la IA gratis que transforma fotos, borra objetos y cambia escenarios, así funciona

La herramienta resulta útil para estudiantes que graban clases, periodistas que gestionan entrevistas o profesionales que organizan notas de voz. Al eliminar la transcripción manual, se reduce tiempo operativo y se mejora el acceso a información clave. Esta mejora convierte a Gemini en una opción más versátil para distintas rutinas de trabajo o estudio.

El soporte para audio no se presenta como un añadido aislado. Se integra a un entorno que ya permite interactuar con texto, imágenes, videos y documentos. Google avanza hacia una IA verdaderamente multimodal que no solo responde, sino que comprende distintos tipos de información en un solo flujo de uso.

Para acceder a la herramienta solo es necesario ingresar en gemini.google.com desde el navegador o utilizar la app para Android o iOS. No se requieren configuraciones adicionales. Si el audio proviene de plataformas como WhatsApp y está FDen formato OPUS, es recomendable convertirlo previamente a un formato compatible para su procesamiento.

Imagen: Generada con IA / ChatGPT

Redacción ENTER.CO

Redacción ENTER.CO

Somos los periodistas e ingenieros que escribimos el medio de tecnología más importante de Latinoamérica, ENTER, que le ofrece contenido sobre tecnología y cultura digital desde 1996.

View all posts

Archivos