Ego4D, el proyecto de Facebook para ver el mundo con ojos humanos

¿Será posible que una maquina pueda ver y percibir el mundo como un ser humano? Pues bien, parece que Facebook está dando sus primeros pasos para que esto ocurra.

La compañía de Marck Zuckerberg sorprendió al mundo con el más reciente anuncio de su nuevo proyecto Ego4D.

Este proyecto de investigación, dirigido por el equipo de inteligencia artificial de Facebook, recopiló más de 2.200 horas de imágenes en primera persona de todo el mundo para entrenar modelos de inteligencia artificial de próxima generación.

¿Cómo funciona este modelo?

La mayoría de la visión de la Inteligencia Artificial actualmente se entrena en imágenes y videos tomados desde una perspectiva en tercera persona, pero para construir asistentes de IA y robots que puedan trabajar con nosotros en el mundo real, los investigadores recopilaron grandes conjuntos de datos basados en lo que se conoce. como percepción egocéntrica.

Es ahí donde la apuesta de Facebook resulta un verdadero desafío para el futuro, ya que lo que busca la compañía es desarrollar asistentes de inteligencia artificial más útiles que puedan registrar todo lo que ven, hacen y oyen las personas para ayudarlas en sus tareas diarias.

También puedes leer: «La inteligencia artificial no puede ser dueño de patentes»

Para esto, la compañía trabaja en que estos sistemas cuenten con habilidades como la memoria episódica (respondiendo preguntas como «¿Dónde dejé mis llaves?»), la manipulación de manos y objetos, pronósticos («Espera, ya le agregaste sal a esta receta»), diarios audiovisuales (recordando quién dijo qué y cuándo) y la interacción social.

“La IA que entiende el mundo desde este punto de vista podría desbloquear una nueva era de experiencias inmersivas, ya que dispositivos como las gafas de realidad aumentada (AR) y los cascos de realidad virtual (VR) se vuelven tan útiles en la vida cotidiana como los teléfonos inteligentes”, aseguró la compañía.

Recolección de datos

Para llevar a cabo la recolección de las más de dos mil horas de video, Facebook se asoció con 13 universidades de todo el mundo.

Estas instituciones fueron las responsables de recopilar los datos de más de 800 participantes de nueve países diferentes que, según The Verge, usaron cámaras GoPro y gafas AR para grabar videos de actividades cotidianas que hacían las personas, esto incluyó desde trabajos de construcción y cocinar hasta pasear a las mascotas y socializar con amigos.

Kristen Grauman, científica de investigación de inteligencia artificial de Facebook, explicó a The Verge, que el conjunto de datos que utilizaron es «el primero de su tipo tanto en escala como en diversidad (…) Hemos abierto los ojos de estos sistemas de inteligencia artificial a más que solo cocinas en el Reino Unido y Sicilia, sino [a imágenes de] Arabia Saudita, Tokio, Los Ángeles y Colombia».

Aunque, Facebook aseguró que este es un proyecto a largo plazo, desde ya muchos investigadores se empiezan a cuestionar sobre la privacidad de estos sistemas. Recordemos que las preocupaciones frente a este tema también ha sido una constante con las gafas Ray-Ban Stories, construidas en alianza entre Facebook y Luxottica, y que fueron lanzadas en septiembre.

Imagen: Archivo ENTER.CO

Karen Ortiz

Karen Ortiz

Periodista con énfasis en Opinión Pública graduada de la Universidad del Rosario con experiencia y conocimientos en redacción, edición y producción. Bailarina en los tiempos libres y apasionada por las buenas historias.

View all posts

Archivos