La última herramienta de inteligencia artificial de la compañía es Sora, un modelo capaz de crear secuencias de vídeo de elevada fidelidad a partir de una simple descripción de texto.
Sora ha llegado. Dall-E es capaz de crear imágenes indistinguibles de una fotografía. ChatGPT responde como lo haría un ser humano. A OpenAI, la empresa detrás de estas inteligencias artificiales, le faltaba conquistar el vídeo. Ahora también puede presumir de haberlo logrado.
Te puede interesar: Samsung Galaxy M15 5G: el nuevo smartphone económico
La última herramienta de inteligencia artificial de la compañía es Sora, un modelo capaz de crear secuencias de vídeo de elevada fidelidad a partir de una simple descripción de texto.
“Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo entiende no sólo lo que el usuario ha pedido, sino también cómo son las cosas en el mundo real”, explican desde OpenAI.
Esperando el 1er comercial en #SoraAi
— Juan Pablo Manazza (@manix2005) February 16, 2024
No es el primer motor generativo que trata de conseguir escenas en movimiento pero hasta ahora los resultados de las alternativas dejaban bastante que desear. Aunque herramientas como Dall-E. Midjourney o Imagen son capaces de crear imágenes estáticas muy realistas, es difícil para una inteligencia artificial mantener la coherencia de los diferentes elementos en una secuencia de vídeo.
Los resultados llegan a ser cómicos, carne de memes. A las manos les crecen dedos, la ropa cambia de color e incluso de talla y corte. Un vídeo especialmente gracioso que circula por la red muestra una recreación del actor Will Smith comiendo espagueti en el que la pasta parece tener vida propia.
Sora tiene fallos también pero logra escenas mucho más realistas que la inmensa mayoría y, tal vez más importante, de mayor duración, hasta de un minuto. Los vídeos tienen también una buena resolución, equivalente a 1080p. Algunos de los ejemplos que OpenAI muestra en su web son realmente sorprendentes y si uno no se fija en los detalles, prácticamente indistinguibles de un vídeo real.
Sora me dejó perplejo, esta generación de video con inteligencia artificial es comparable con la aparición del cine. La realidad artificial vea! #SoraAI #OpenAI #Sora #SamAltman pic.twitter.com/krLZjoFpwp
— Oscar Hincapie GAFO (@elgafohincapie) February 16, 2024
El motor consigue también crear escenas convincentes de animación tridimensional o mezclar objetos realistas con otros claramente generados por ordenador.
El realismo de los resultados vuelve a poner el foco en el potencial de estas herramientas en campañas de desinformación. Es relativamente sencillo crear escenas que pueden parecer reales pero que son imaginarias, mucho más de lo que era posible conseguir hasta ahora con avanzadas herramientas de edición de vídeo y audio.
SORA can animate images pretty amazingly.
Prompt: “In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave.”#SoraAI pic.twitter.com/LLFKtjjxKL
— Salis khizar khan (@Salis_khizar_k) February 16, 2024
De momento OpenAI no ha abierto la herramienta a cualquier usuario. Sólo un reducido número de académicos, profesionales y un equipo de seguridad encargado de buscar posibles fallos tendrá acceso a Sora en sus primeras versiones.
El modelo tiene además las mismas limitaciones que Dall-E, el motor generativo de imágenes estáticas. No puede generar vídeos de personal reales o con contenido sexual o violento. “Dialogaremos con responsables políticos, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología”, explican desde OpenAI.