Mistral lanza Voxtral, su modelo de código abierto para transcripción y comprensión de voz

julio 16, 2025

La empresa francesa Mistral lanzó Voxtral, un modelo de inteligencia artificial enfocado en transcripción y comprensión de voz. Es capaz de procesar audios de hasta 30 minutos para transcripción y 40 minutos para tareas de análisis y resumen de contenido. El modelo puede responder preguntas directamente sobre lo que se escucha en el audio.

Voxtral se lanza en dos versiones: una de 24 mil millones de parámetros orientada a entornos de producción y otra de 3 mil millones pensada para ejecución local o en dispositivos de borde. Ambas están disponibles bajo licencia Apache 2.0. La descarga se puede realizar desde Hugging Face y también se ofrece acceso mediante API.

Entre sus funciones se incluyen transcripción, generación de resúmenes estructurados, detección automática de idioma y respuestas a preguntas sin necesidad de encadenar modelos separados. Estas capacidades buscan facilitar el uso de la voz como una interfaz directa con los sistemas digitales. También se admite la activación de funciones a partir de comandos hablados.

Mistral afirma que Voxtral supera a modelos como Whisper de OpenAI y Scribe de ElevenLabs en tareas multilingües. En pruebas con inglés, español, francés, alemán, portugués, hindi y otros idiomas, el modelo mostró menores tasas de error en la transcripción. También obtuvo buenos resultados en comprensión semántica y generación de respuestas.

La compañía señala que uno de los principales diferenciadores es el costo. Voxtral Mini Transcribe, por ejemplo, ofrece mayor rendimiento que Whisper a menos de la mitad del precio. El acceso a la API comienza en 0,001 dólares por minuto, lo que permite su uso en proyectos de gran escala con presupuestos limitados.

Te puede interesar: La nueva IA china que programa sola: así funciona Kimi K2, pensada para desarrolladores

En términos de integración, Voxtral está diseñado para funcionar con una sola llamada de API. Además, se puede probar directamente en Le Chat, el asistente conversacional de Mistral, disponible en versión web y móvil. Los usuarios pueden grabar o subir un audio, obtener la transcripción y realizar preguntas sobre el contenido.

El modelo también conserva la capacidad de comprensión de texto de su arquitectura base, Mistral Small 3.1. Esto permite utilizarlo como reemplazo en tareas que combinan procesamiento de texto y voz. Asimismo, incluye un punto de acceso optimizado exclusivamente para transcripción, enfocado en la eficiencia de costos.

Para entornos empresariales, Mistral ofrece opciones de implementación privada, soporte para dominios especializados y herramientas de integración personalizadas. También se encuentran en desarrollo funciones adicionales como segmentación por hablante, análisis emocional, marcas temporales por palabra y reconocimiento de audio no verbal.

El lanzamiento de Voxtral marca un avance en la oferta de modelos abiertos para voz y comprensión auditiva. Mistral busca posicionarse como una opción accesible para organizaciones que necesitan soluciones avanzadas sin depender de APIs cerradas. Según la empresa, el objetivo es facilitar interacciones naturales entre humanos y sistemas digitales.

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Mistral lanza Voxtral, su modelo de código abierto para transcripción y comprensión de voz

Te puede interesar: La nueva IA china que programa sola: así funciona Kimi K2, pensada para desarrolladores

Digna Irene Urrea

Relacionados

Nequi y AWS abren 300.000 cursos gratis de inteligencia artificial en Colombia

¿Cómo usar Health AI de Amazon para consultar síntomas y resultados médicos?

Alexa ahora puede responder con distintas personalidades y así funciona la nueva opción de Alexa+

Claude destrona a ChatGPT en la App Store y reaviva la carrera de las inteligencias artificiales

Microsoft lanza Copilot Health la inteligencia artificial que analiza tus exámenes médicos y datos de salud

Honor sorprende con un celular que se mueve como robot y suma más de 70 premios por su tecnología de IA

Lo más leído de la semana

Galaxy S26 Ultra vs Motorola Signature cuál elegir en 2026 y por qué

HONOR Magic V6 vs OPPO Find N6: comparación de diseño, potencia y cámaras en los nuevos plegables premium

POCO X8 Pro en Colombia: más rendimiento y batería de hasta 8.500 mAh

Xiaomi 17 Ultra vs Honor Magic 8 Pro: lo que necesitas saber antes de comprar

Nequi y AWS abren 300.000 cursos gratis de inteligencia artificial en Colombia

OPPO Find X9 Ultra: 4 cámaras de 200 MP con Master Kit incluido

POCO X8 Pro vs Pro Max: ¿qué cambia y cuál elegir según tu uso?

El Tesla Model Y ya se vende en Colombia: se controla desde el celular y estas son 6 funciones tecnológicas que sorprenden

Archivos

Mistral lanza Voxtral, su modelo de código abierto para transcripción y comprensión de voz

Te puede interesar: La nueva IA china que programa sola: así funciona Kimi K2, pensada para desarrolladores

Digna Irene Urrea

You may also like

Relacionados

Lo más leído de la semana

Archivos