Esta es la apuesta de OpenAI para interpretar mejor la intención humana con IA

Inteligencia Artificial

OpenAI ha anunciado que busca grandes conjuntos de datos que representen la intención humana y que aún no estén disponibles públicamente en línea. Recientemente, el gigante tecnológico anunció el modelo de inteligencia artificial GPT-4 Turbo, que admite tokens de 128K. Esta es la nueva estrategia.

OpenAI puede utilizar todo tipo de datos, incluidos texto, imágenes, audio y vídeo, pero está especialmente interesada en datos que muestren la intención humana, como conversaciones o escritos extensos.

Para este objetivo, la compañía busca trabajar con organizaciones para producir conjuntos de datos públicos y privados, entrenando modelos de inteligencia artificial (IA). ChatGPT, que puede generar poemas y prosa a partir de indicaciones simples, se basa en grandes modelos de lenguaje entrenados completamente con datos de código abierto.

 Te puede interesar: Buscador SGE de Google llega a Colombia ¿Qué ofrece esta IA generativa en resultados?

La compañía se encamina a producir datos de capacitación más matizados y con un estilo más conversacional. «Estamos buscando particularmente datos que expresen la intención humana, en cualquier idioma, tema y formato», afirmó la compañía en su blog.

Además argumenta que «la tecnología moderna de IA aprende habilidades y aspectos de nuestro mundo (de las personas, nuestras motivaciones, interacciones y la forma en que nos comunicamos) al darle sentido a los datos con los que se entrena. Para, en última instancia, hacer que la AGI sea segura y beneficiosa para toda la humanidad, nos gustaría que los modelos de IA comprendan en profundidad todos los temas, industrias, culturas e idiomas, lo que requiere un conjunto de datos de capacitación lo más amplio posible.»

Para este fin busca socios que le ayuden a crear un conjunto de datos de código abierto para entrenar modelos de lenguaje. Este conjunto sería público para que cualquiera lo utilice en el entrenamiento de modelos de IA.

 Te puede interesar: Samsung lanza ‘su propio ChatGPT’, Gauss genera texto, código e imágenes

Así mismo está preparando conjuntos de datos privados para entrenar modelos de IA patentados. «También nos asociamos con la organización sin fines de lucro Free Law Project , cuyo objetivo es democratizar el acceso a la comprensión jurídica al incluir su gran colección de documentos legales en la capacitación en IA. Sabemos que puede haber muchos más que también quieran contribuir al futuro de la investigación en IA mientras descubren el potencial de sus datos únicos.»

OpenAI trabaja con muchos socios que representarían datos de su país o industria; como gobierno de Islandia y Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés mediante la integración de sus conjuntos de datos seleccionados.

Imagen: Archivo ENTER.CO

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos