Bahía Blanca | Lunes, 11 de agosto

Bahía Blanca | Lunes, 11 de agosto

Bahía Blanca | Lunes, 11 de agosto

Cómo funciona Sora, la nueva inteligencia artificial para generar videos

Esta nueva herramienta de OpenAI puede crear escenas complejas con varios personajes. Se puede especificar el tipo de movimiento y el entorno.

Entrenada con una enorme biblioteca de vídeos, genera vídeos a partir de comandos textuales.

Sora es el nuevo sistema de inteligencia artificial creado por OpenAI, de la mano de los creadores de ChatGPT y DALL-E, que vuelven a innovar en el sector. Así como ChatGPT genera texto y DALL-E genera imágenes a partir de texto, Sora genera vídeos a partir de comandos textuales. De momento solo está disponible para investigadores de la empresa, pero promete ser la próxima gran revolución.

Esta inteligencia artificial es muy similar a los modelos que crean imágenes a partir de texto, y que a la vez se basa en parte de la tecnología de modelos de lenguaje como GPT. Este sistema es capaz de entender lo que le pides con un lenguaje natural, ya que ha sido entrenada para entender la manera en la que solemos hablar y cómo nos expresamos para pedir o preguntar algo.

Después de entender el pedido, Sora genera vídeos sobre la temática, un enorme paso más con respecto a la creación de imágenes de inteligencias anteriores. Esto es posible porque ha sido entrenada con una enorme biblioteca de vídeos, de forma que sabe reconocer movimientos y descripciones. Sabe a que nos referimos con los tipos de personas, de vestimenta, de accesorios o de efectos visuales.

Sora es capaz de generar escenas complejas en las que aparezcan varios personajes. También se puede especificar el tipo de movimiento y el entorno. 

En el vídeo a continuación, se le ha pedido a Sora que cree a una mujer elegante caminando por una calle de Tokyo llena de neones, y con señalizaciones urbanas. También se describió la vestimenta al detalle, así como sus gafas de sol o pintalabios.

"Una mujer elegante camina por una calle de Tokio llena de cálidos neones brillantes y animada señalización urbana. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y pintalabios rojo. Camina con seguridad y despreocupación. La calle está húmeda y es reflectante, lo que crea un efecto espejo de las luces de colores. Muchos peatones pasean".

Al igual que el resto de las inteligencias artificiales, las capacidades de Sora dependen de la habilidad de cada usuario para crear pedidos complejos, mediante los que, con descripciones elaboradas, se pueden obtener resultados a medida. Cuanto más detallada sea la descripción, más detallada será la imagen que creará Sora.

De momento, este modelo de inteligencia artificial está en una fase temprana de su desarrollo, y genera vídeos de hasta 60 segundos. Además, la empresa advierte que puede tener algunos problemas a la hora de recrear con exactitud algunas físicas.

OpenAI asegura que Sora se acabará incorporando al catálogo de productos de la empresa, pero todavía no ha dado ninguna fecha concreta para ello.