OpenAI ha introducido salidas estructuradas en su API, una funcionalidad que promete transformar la manera en que los desarrolladores generan y gestionan datos estructurados, garantizando una mayor fiabilidad y precisión en las aplicaciones que utilizan inteligencia artificial.
El año pasado, durante el evento DevDay, OpenAI presentó el modo JSON, una herramienta que mejoró la capacidad de los modelos para generar salidas JSON válidas.
Sin embargo, este modo no aseguraba que las respuestas del modelo se ajustaran a esquemas específicos, lo que podía ser un problema para los desarrolladores que necesitaban una mayor precisión. Con la nueva función de salidas estructuradas, esto cambia por completo.
Las salidas estructuradas son una nueva característica de la API de OpenAI que permite que las respuestas del modelo se ajusten exactamente a los esquemas JSON proporcionados por los desarrolladores. Esta función es especialmente útil para crear aplicaciones que necesitan generar datos estructurados de manera consistente y precisa.
¿Cómo funciona?
OpenAI ha introducido salidas estructuradas en dos formatos principales dentro de su API:
Llamada de función: esta función permite a los desarrolladores configurar la opción strict: true dentro de la definición de la función. Al hacerlo, las salidas del modelo coincidirán con la definición de la herramienta proporcionada. Esta funcionalidad es compatible con todos los modelos que soportan herramientas, incluyendo los modelos gpt-4-0613 y gpt-3.5-turbo-0613 en adelante.
Parámetro response_format: los desarrolladores ahora pueden proporcionar un esquema JSON utilizando la nueva opción json_schema para el parámetro response_format. Esto es útil cuando el modelo necesita responder de manera estructurada sin llamar a una herramienta específica. Esta característica es compatible con los modelos más recientes de GPT-4, como el gpt-4o-2024-08-06 y el gpt-4o-mini-2024-07-18.
En tanto a seguridad es una prioridad para OpenAI, y la nueva funcionalidad de salidas estructuradas cumple con las políticas de seguridad existentes. El modelo puede rechazar solicitudes inseguras y generar respuestas confiables que se ajusten a los esquemas proporcionados.
Para facilitar este proceso, se ha introducido un nuevo valor de cadena llamado refusal en las respuestas de la API, que permite a los desarrolladores detectar si el modelo ha rechazado una solicitud en lugar de generar una salida válida.
OpenAI también explica que ha actualizado sus SDKs de Python y Node para soportar nativamente las salidas estructuradas. Proporcionar un esquema para herramientas o como formato de respuesta es tan sencillo como utilizar un objeto Pydantic o Zod. Los SDKs se encargan de convertir el tipo de datos a un esquema JSON compatible, deserializar la respuesta JSON y manejar los rechazos de manera automática.
¿Cómo se pueden utilizar?
Las salidas estructuradas abren un mundo de posibilidades para los desarrolladores. Algunos ejemplos de cómo se pueden utilizar incluyen:
Generación dinámica de interfaces de usuario: Los desarrolladores pueden crear aplicaciones que generen código o interfaces de usuario basadas en la intención del usuario.
Separación de respuestas finales y razonamiento de apoyo: Al dar al modelo un campo separado para la cadena de pensamiento, se puede mejorar la calidad final de las respuestas.
Extracción de datos estructurados: El modelo puede extraer tareas pendientes, fechas de vencimiento y asignaciones de notas de reuniones, facilitando la gestión de información.
Imagen: Archivo de ENTER.CO