La startup Cerebras IA lanza 7 modelos GPT para usarlos gratis ¿Competencia para OpenAI?

marzo 28, 2023

Cerebras Systems, una startup estadounidense de inteligencia artificial anunció el lanzamiento de una serie de siete modelos de lenguaje grande (LLM) similares a GPT que podrán ser usados de manera gratuita por la comunidad investigadora y científica.

La compañía que tiene sede en Silicon Valley, entrenó los siete modelos en 16 sistemas CS-2 en la supercomputadora Cerebras Andromeda AI, incluidos modelos de lenguaje más pequeños de 111 millones de parámetros a un modelo más grande de 13 mil millones de parámetros.

Startup explica que por lo general entrenar siete modelos GPT con parámetros de 111 millones puede tardar meses, sin embargo, con la supercomputadora Andromeda fueron capaces de hacerlo en pocas semanas, ya que esta cuenta con una velocidad “increíble” de los sistemas Cerebras CS-2 que componen el hardware de IA y la capacidad de la arquitectura de flujo de peso del sistema para eliminar el dolor de la computación distribuida.

The AI industry is becoming increasingly closed. We believe in fostering open access to the most advanced models. Cerebras-GPT is being released under the Apache 2.0 license, allowing royalty-free use for research or commercial applications. (2/5) pic.twitter.com/IYI4dROx9Q

— Cerebras Systems (@CerebrasSystems) March 28, 2023

“Pocas organizaciones son capaces de entrenar modelos verdaderamente a gran escala. Aún menos lo han hecho en hardware de IA dedicado. Lanzar siete modelos GPT completamente entrenados a la comunidad de código abierto muestra cuán eficientes pueden ser los clústeres de los sistemas Cerebras CS-2 y cómo pueden resolver rápidamente los problemas de IA de mayor escala, problemas que generalmente requieren cientos o miles de GPU, explica Sean Lie, cofundador y arquitecto jefe de software en Cerebras.

¿Qué se puedes hacer con los siete modelos de lenguaje grande?

De acuerdo con la compañía, los modelos preentrenados proporcionan una alta precisión para un ajuste fino. “Al aplicar una cantidad modesta de datos personalizados, cualquiera puede crear aplicaciones potentes y específicas de la industria con un trabajo mínimo. Los diversos tamaños de los modelos y los puntos de control que los acompañan permiten a los investigadores de IA crear y probar nuevas optimizaciones y flujos de trabajo que benefician ampliamente a la comunidad”, reseña el comunicado.

Además, el código abierto de Cerebras-GPT, está listo para ser utilizado y reproducido por cualquier persona.

Por sus parte, Karl Freund, consultor de chips en Cambrian AI, explicó a Reuters, que los modelos más grandes no siempre significada que sean mejor; por ejemplo cuando OpenAI lanzó ChatGPT, este cuenta con 175 millones de parámetros y puede producir poesía e investigación, sin embargo, los modelos más pequeños se pueden implementar en teléfonos o parlantes inteligentes, mientras que los más grandes se ejecutan en PC o servidores.

“Se han publicado algunos artículos interesantes que muestran que (un modelo más pequeño) puede ser preciso si lo entrenas más. Así que hay una compensación entre más grande y mejor entrenado”, señaló Freund

Los siete modelos Cerebras-GPT ya están disponibles en Hugging Face y Cerebras Model Zoo en GitHub bajo la licencia Apache 2.0.

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

La startup Cerebras IA lanza 7 modelos GPT para usarlos gratis ¿Competencia para OpenAI?

¿Qué se puedes hacer con los siete modelos de lenguaje grande?

Digna Irene Urrea

Relacionados

Etiquetas, muebles y cortinas: los inesperados usos de las nuevas impresoras de HP

Con el 90% de las búsquedas, Google enfrenta nuevas reglas para una competencia más justa

¿Sabías que un niño perdido usó Google Earth para encontrar a su madre tras 25 años? Ahora la herramienta cumple 20 años

Lenovo Chromebook Plus 14 se mide con el MacBook Air: 1,17 kg, 17 horas de autonomía y Gemini 2.5 Pro incluido

Amazon envía más satélites Kuiper y desafía a Starlink: qué tan cerca está de ofrecer internet satelital y cuál es hoy la mejor oferta

Así funciona la tecnología que permite a Israel alertar a su población en segundos ante ataques con misiles

Lo más leído de la semana

¿Qué estudiar hoy para tener empleo en 2030? Las habilidades que más demandará el mercado

Ramo y AWS abren 75 mil cupos gratuitos para capacitarse en IA y computación en la nube en Colombia: Así te puedes inscribir

Automatiza tu trabajo sin ser programador: así funciona el programa Python for Business

Las posibilidades para que la Generación Z ejerza estos oficios son (casi) nulas: carreras que la IA ya ha desplazado

Microsoft lanza la actualización Windows 11, versión 24H2: disponibilidad, mejoras y cómo obtenerla

Estos son los artículos de la reforma laboral que empiezan a regir desde julio 2025 y que pueden mejorar su salario

Swift Móvil lanza planes desde $12.500 y aumenta la presión sobre Virgin y Wom

Triángulos y rectángulos en los semáforos, así es el nuevo diseño que verás en las calles

Archivos

La startup Cerebras IA lanza 7 modelos GPT para usarlos gratis ¿Competencia para OpenAI?

¿Qué se puedes hacer con los siete modelos de lenguaje grande?

Digna Irene Urrea

You may also like

Relacionados

Lo más leído de la semana

Archivos