Un grupo de investigadores brasileños evaluó si los modelos de lenguaje de gran tamaño (LLM) pueden ayudar a detectar el trastorno depresivo mayor a partir de notas de voz enviadas por WhatsApp. El estudio, publicado el 21 de enero de 2026 en la revista científica PLOS Mental Health, analizó grabaciones reales de pacientes y voluntarios para identificar patrones acústicos asociados con la depresión.
La investigación fue liderada por Victor HO Otani, de la Facultad de Ciencias Médicas de Santa Casa de São Paulo e Infinity Doctors Inc., junto con otros especialistas. El equipo trabajó exclusivamente con hablantes nativos de portugués brasileño y aplicó técnicas de aprendizaje automático para clasificar a personas con diagnóstico clínico de depresión y a participantes sin el trastorno.
Para el desarrollo del modelo se utilizaron dos conjuntos de datos independientes. El primero, destinado al entrenamiento, incluyó 86 participantes: 45 pacientes ambulatorios diagnosticados con trastorno depresivo mayor y 41 personas sin depresión. El segundo conjunto, empleado para probar el rendimiento de los modelos, estuvo compuesto por 74 individuos entre pacientes y grupo de control.
Te puede interesar: ¿Por qué los relojes inteligentes se equivocan al medir estrés y depresión, según la ciencia?
Los audios provenían de mensajes de voz cotidianos. En el caso de los pacientes, eran grabaciones enviadas a sus médicos cuando reportaban síntomas. Los voluntarios compartieron mensajes habituales. En la fase de prueba, todos grabaron dos tipos de audio: uno contando del 1 al 10 y otro describiendo cómo había sido su semana. Antes del análisis, los investigadores realizaron un proceso de limpieza del audio y extracción de características acústicas, y luego evaluaron siete algoritmos distintos dentro de un sistema estandarizado.
Precisión alta en mujeres y menor en hombres
El modelo con mejor desempeño logró una precisión del 91,9 % en la identificación de mujeres con depresión cuando analizó la grabación en la que describían su semana. En hombres, la precisión fue del 75 % en esa misma prueba. En el ejercicio de contar del 1 al 10, los resultados fueron más equilibrados: 82 % en mujeres y 78 % en hombres.
Los autores atribuyen esta diferencia a la mayor presencia femenina en el conjunto de entrenamiento y a posibles variaciones en los patrones de habla entre géneros. Cambios en el ritmo, la entonación o la energía vocal pueden ser señales asociadas con la depresión y manifestarse de manera distinta.
Te puede interesar: Scroll infinito: cómo afecta la atención, la ansiedad y el consumo digital
El trastorno depresivo mayor afecta a más de 280 millones de personas en el mundo. La detección temprana puede facilitar intervenciones oportunas, especialmente en lugares con acceso limitado a servicios de salud mental. Según los investigadores, el análisis automatizado de mensajes de voz podría convertirse en una herramienta complementaria, de bajo costo y alineada con hábitos de comunicación cotidianos.
No obstante, el estudio reconoce limitaciones como el tamaño de la muestra y la necesidad de validar los resultados en otras poblaciones y lenguas. Cualquier aplicación futura también deberá garantizar privacidad y consentimiento informado.
Imagen: generada con IA