Así es POINT-E, la nueva tecnología de Inteligencia Artificial que genera imágenes 3D

Point·E

OpenAI lanzó una nueva tecnología de Inteligencia Artificial para crear imágenes 3D. Se trata POINT-E que puede producir nubes de puntos directamente desde mensajes de texto. Esta nueva herramienta podría ser superior a algunas ya existentes como DreamFusion de Google.

El nuevo chabot explora un método de generación de objetos 3D que produce modelos 3D en tan solo uno o dos minutos en una sola Unidad de Procesamiento Gráfico (GPU).

La investigación señala que para que Point·E produzca estas imágenes se debe a un método, en el que inicialmente debe“generar una sola vista sintética usando un modelo de difusión de texto a imagen y luego produce una nube de puntos 3D, usando un segundo modelo de difusión que condiciona la imagen generada”.

Sin embargo, OpenAI es consciente de que aún la metodología no alcanza “un estado del arte en términos de calidad de la muestra”, no obstante rescata que el método si es mucho más rápido para “muestrear, lo que ofrece una compensación práctica para algunos casos de uso”.

Te puede interesar: ChatGPT, la nueva tecnología de Inteligencia artificial que superaría a Alexa y Siri

Cabe recordar, que 3D significa tridimensional y hace referencia a que un objeto o espacio tiene características físicas y observables como el ancho, la altura y la profundidad.

La compañía de investigación de Inteligencia Artificial, creada por Elon Musk en 2015, combina modelos generativos de texto a imagen para generar y modificar imágenes de alta calidad a partir de descripciones en lenguaje natural en segundos.

Lo que quiere decir, es que para producir un objeto 3D a partir de un indicador de texto, primero muestrean una imagen usando el modelo de texto a imagen y luego muestrean un objeto 3D, condicionado a la imagen muestreada. “Ambos pasos se pueden realizar en varios segundos y no requieren costosos procedimientos de optimización”, reseña el documento.

Te puede interesar: ChatGPT: ¿lo que no sabe se lo inventa? «No es inteligente, es peligroso»

Aunque, Point·E hasta la fecha ha entregado resultados sobresalientes en términos de agilidad en la creación de una imagen tridimensional, OpenAI, explica que el sistema de creación de imágenes 3D tienen varias limitaciones, una de ella está relacionada con la baja resolución de un formato 3D que no captura formas o texturas de grano fino, pese a que produce formas tridimensionales coloreadas.

Finalmente la compañía señala que el método para producir representaciones 3D de alta calidad, como mallas o NeRF, podría permitir que los resultados del modelo se utilicen para una variedad de aplicaciones. “Este método podría usarse para inicializar técnicas basadas en optimización para acelerar la convergencia inicial”.

Imagen: Captura de pantalla

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos