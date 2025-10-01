OpenAI presentó GDPval, un sistema de evaluación diseñado para medir cómo los modelos de inteligencia artificial resuelven tareas reales y valiosas para la economía. El análisis toma como referencia el PIB de Estados Unidos, con 44 ocupaciones de nueve sectores clave, aunque sus hallazgos ofrecen una visión aplicable al debate global sobre cómo la IA impacta el trabajo humano.



El nombre GDPval proviene del producto interior bruto (PIB), utilizado como indicador económico para seleccionar los sectores clave. Con esta referencia, OpenAI busca sustituir la especulación sobre el futuro del trabajo por datos verificables y comparables, y así aportar una base sólida al debate sobre el impacto de la IA en la economía y el empleo.

Para la evaluación, se definieron tareas representativas dentro de cada ocupación, construidas a partir de la práctica real de trabajadores con una media de 14 años de experiencia. Estas actividades se asignaron tanto a los modelos de IA como a expertos humanos, y se clasificaron según el desempeño fuese mejor, igual o inferior. Los resultados mostraron que los modelos más avanzados alcanzan una calidad cercana a la de profesionales del sector, con mejoras lineales generación tras generación.

Además de la calidad, OpenAI comprobó que la IA ejecuta muchas de estas tareas hasta 100 veces más rápido y con costes significativamente menores. El informe también destaca que, al combinarse con la supervisión humana, los modelos permiten procesos más eficientes y económicos que los flujos de trabajo tradicionales, lo que refuerza su potencial como herramienta de apoyo más que como sustituto total.

El listado de ocupaciones incluye ejemplos tan diversos como abogados, desarrolladores de software, ingenieros mecánicos e industriales, auditores, gestores de proyectos, enfermeras, farmacéuticos, asistentes médicos, productores, reporteros y agentes inmobiliarios, entre otros. Todas ellas muestran tareas específicas donde la IA ya compite con el trabajo humano en calidad y velocidad.

OpenAI también observó que el rendimiento de los modelos mejora cuando se les proporciona mayor contexto, más pasos de razonamiento y estructuras de apoyo. Para fomentar la investigación, la compañía liberó un subconjunto de referencia con 220 tareas y habilitó un servicio público de calificación automatizada, pensado para seguir midiendo de forma abierta las capacidades de los modelos en situaciones reales.

De cara al futuro, la compañía planea ampliar GDPval a más sectores y tipos de tareas, con el objetivo de contar con una herramienta robusta que refleje mejor la evolución de la IA en el mundo laboral. La apuesta, según OpenAI, no es reemplazar empleos completos, sino liberar a los profesionales de tareas repetitivas para que dediquen más tiempo a labores creativas y estratégicas, contribuyendo así a un mayor crecimiento económico.

Imagen: Generada con IA / ChatGPT