Así es MiDashengLM-7B, la nueva inteligencia auditiva de Xiaomi que supera a todos los asistentes de voz

agosto 12, 2025

Xiaomi liberó el código de MiDashengLM-7B, su modelo más avanzado para el reconocimiento y la comprensión de sonido. No se trata de una herramienta más para transcribir voz: identifica palabras, detecta ruidos y analiza música con un nivel de detalle que lo coloca entre los más precisos del mundo. Sus resultados han roto marcas en 22 evaluaciones de referencia internacionales.

Este modelo combina el codificador de audio Xiaomi Dasheng con el decodificador autorregresivo Qwen2.5-Omni-7B Thinker. Su entrenamiento sigue una estrategia de audiodescripción universal, lo que le permite comprender diferentes tipos de sonido y situarlos en contexto. En lugar de procesar datos de forma aislada, interpreta lo que ocurre a su alrededor.

Uno de sus puntos más llamativos es la velocidad. El tiempo para procesar la primera palabra de una muestra es solo una cuarta parte del de otros sistemas similares, y su capacidad para manejar tareas en paralelo multiplica por veinte la eficiencia con la misma memoria. Esto lo hace ideal para aplicaciones en tiempo real, desde asistentes inteligentes hasta sistemas de seguridad.

Un oído que entiende el entorno y habla con el usuario

MiDashengLM-7B va más allá de la voz humana. Puede detectar sonidos extraños en casa, distinguir el golpeteo de una puerta del goteo de una fuga de agua o advertir patrones irregulares en un motor. En el ecosistema de Xiaomi, ya forma parte de altavoces, coches y dispositivos domésticos para controlar ambientes, reforzar la seguridad y personalizar experiencias.

La serie Dasheng debutó en 2024 con un hito: superar la métrica mundial AudioSet 50+ mAP en análisis de voz, música y sonido ambiental. Ese liderazgo se mantiene y ahora se amplía con un modelo que, además de procesar, interactúa con las personas de manera más natural.

En la práctica, esto significa que puede corregir la pronunciación, aconsejar sobre técnica vocal o aprendizaje de idiomas y responder en tiempo real sobre sonidos del entorno mientras se conduce. No solo detecta, también interpreta y ofrece respuestas útiles.

Una diferencia clave frente a otros modelos es la transparencia. Xiaomi ha liberado el código bajo licencia Apache 2.0 y publicado la lista completa de las 77 fuentes de datos que utilizó, junto a un informe técnico que describe el proceso de desarrollo. Esto permite a investigadores y empresas adaptarlo sin depender de la infraestructura de la marca.

Te puede interesar: ¿Qué es Copilot, en qué se diferencia de ChatGPT y para qué sirve realmente?

El modelo se entrenó con datos 100% públicos, reduciendo riesgos de sesgos y abriendo posibilidades para proyectos que exigen trazabilidad. Xiaomi ya trabaja en optimizarlo para funcionar sin conexión, lo que ampliará su uso en dispositivos y lugares con conectividad limitada.

La apuesta es integrarlo en el ecosistema “persona–auto–hogar” para que la inteligencia artificial no solo responda, sino que entienda el contexto real de cada usuario. El objetivo es que las interacciones no parezcan dictadas por un algoritmo, sino conversaciones naturales y útiles.

Con MiDashengLM-7B, Xiaomi apunta a una nueva generación de inteligencia auditiva: rápida, precisa y abierta a todos. Su liberación impulsa la innovación en la comunidad de desarrolladores y marca un paso que otras empresas, aún reticentes a compartir sus modelos, podrían verse obligadas a seguir.

Imagen: Archivo ENTER.CO

DashengLM-7B Xiaomi

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Así es MiDashengLM-7B, la nueva inteligencia auditiva de Xiaomi que supera a todos los asistentes de voz

Un oído que entiende el entorno y habla con el usuario

Te puede interesar: ¿Qué es Copilot, en qué se diferencia de ChatGPT y para qué sirve realmente?

Digna Irene Urrea

Relacionados

IBM alerta: la inteligencia artificial ya está filtrando datos dentro de las empresas sin que nadie lo note

Google ofrece Gemini Pro gratis y acceso total a sus herramientas de IA: así puedes obtenerlo por un año

¿Cómo la inteligencia artificial está acelerando los tribunales en América Latina y qué riesgos trae?

Google presenta Gemini Enterprise: su nueva plataforma unificada de inteligencia artificial para empresas

AI Plus llega a Colombia: las funciones, precios y beneficios del plan de Google con Gemini

Probamos Nano Banana: sorprende al colorear fotos en blanco y negro sin alterar los rasgos ni los tonos reales de piel y crea retratos realistas en segundos

Lo más leído de la semana

HONOR anuncia el lanzamiento de la Serie Magic 8 con botón dedicado a inteligencia artificial

Los 5 Motorola con mejor relación precio-calidad en 2025: potencia, buena batería y sin pagar de más

Samsung Galaxy S25 FE vs Galaxy A56 5G: el dilema entre lo premium accesible y el equilibrio inteligente

Cómo actualizar a Windows 11 gratis en 2025 (y la forma “oculta” para PCs incompatibles)

Petro sanciona Ley que pone tope a los cobros por reconexión: adiós a los $40.000 por volver a tener internet: Esto te cobrarán

Del televisor al proyector portátil, así está cambiando la forma de disfrutar el entretenimiento en streaming

Vivo lanza los X300 y X300 Pro con tecnología Gimbal, sensores de alta resolución y Android 16

Así es la serie nova 14 de Huawei presentada en Colombia, una apuesta por el diseño, la fotografía y la carga ultrarrápida

Archivos

Así es MiDashengLM-7B, la nueva inteligencia auditiva de Xiaomi que supera a todos los asistentes de voz

Un oído que entiende el entorno y habla con el usuario

Te puede interesar: ¿Qué es Copilot, en qué se diferencia de ChatGPT y para qué sirve realmente?

Digna Irene Urrea

You may also like

Relacionados

Lo más leído de la semana

Archivos