Meta sigue apostando fuerte por una inteligencia artificial más cercana al comportamiento humano. Su último avance, V-JEPA 2, no solo representa una evolución técnica, sino también una declaración de intenciones sobre el futuro de los robots autónomos. Con este modelo, la compañía quiere que las máquinas entiendan el mundo físico con la misma soltura con la que lo hace una persona.
¿Cómo funciona V-JEPA 2?
V-JEPA 2 es la segunda generación de una arquitectura desarrollada por el equipo de investigación fundamental en IA de Meta. A diferencia de los sistemas clásicos, no depende de anotaciones humanas. Se entrena viendo vídeos y aprende por observación, anticipando lo que puede suceder, imaginando acciones y tomando decisiones sobre cómo resolver una tarea.
Ya no se trata de seguir instrucciones al pie de la letra, sino de interpretar metas y actuar con flexibilidad. Meta ha probado este sistema en robots reales que lograron tareas simples como mover objetos, incluso en espacios que no conocían. El robot no imita, razona en función del entorno, como lo haría cualquier persona al enfrentarse a una situación nueva.
Te puede interesar: Inteligencia Artificial General (IAG): el enigmático grupo secreto de Meta que lidera su desarrollo ¿De qué se trata?
Inteligencia contextual en acción
Con una arquitectura de 1.200 millones de parámetros, este modelo construye lo que se conoce como un “espacio latente”. Es una representación interna que le permite simular futuros posibles y elegir la mejor acción. Ya no repite pasos programados, sino que adapta su comportamiento según la situación.
Aunque es avanzado, tiene límites. Por ahora, solo opera en una escala temporal, lo que dificulta tareas complejas como cocinar o armar objetos. Meta trabaja para que integre más sentidos como sonido o tacto, y así aumentar su capacidad de adaptación.
Un modelo abierto para avanzar
En línea con su visión de una IA colaborativa, Meta ha liberado el código de V-JEPA 2 y ha publicado tres nuevos benchmarks diseñados para evaluar la capacidad de estas tecnologías para razonar sobre el mundo físico a partir de vídeos. Esta apertura busca impulsar el trabajo conjunto con la comunidad científica y acelerar los avances en este campo.
El objetivo final es crear sistemas capaces de desenvolverse de forma autónoma en el mundo real sin depender de scripts ni escenarios preparados. La compañía avanza así hacia una inteligencia artificial que no solo ve, sino que entiende, aprende y actúa, adaptándose a lo inesperado. Un paso más hacia una tecnología verdaderamente útil.
Imagen: Generada con IA / ChatGPT