Internet

Sora: Qué es, cómo funciona y qué se puede hacer con la inteligencia artificial de OpenAI para la creación de vídeos

OpenAI ha sorprendido una vez más con su última creación en inteligencia artificial. Hoy, te presentamos a Sora, el innovador sistema diseñado por los mismos creadores de ChatGPT y DALL-E.

Sora es una revolución en el ámbito de la inteligencia artificial. Similar a cómo ChatGPT crea texto y DALL-E transforma texto en imágenes, Sora tiene la capacidad de generar vídeos basados en instrucciones textuales. Por ahora, este modelo solo está disponible para investigadores de la empresa. Sin embargo, se anticipa que marcará un antes y un después en la industria.

¿Qué es precisamente Sora?

Sora es una innovación en inteligencia artificial creada por OpenAI, la empresa detrás de desarrollos como ChatGPT y DALL-E. A diferencia de sus predecesores, Sora se especializa en generar vídeos a partir de textos. Simplemente escribes tus deseos en un comando textual y Sora los convierte en realidad visual.

Al igual que los sistemas que transforman textos en imágenes, Sora se apoya en la tecnología de modelos de lenguaje, como GPT. Está programada para comprender el lenguaje natural, adaptándose a la forma en que las personas hablan y expresan sus peticiones.

Una vez que Sora entiende lo que se le solicita mediante un prompt, es capaz de crear vídeos que materializan esas instrucciones en acción. Este avance representa un salto significativo más allá de la simple generación de imágenes estáticas.

El éxito de Sora radica en su entrenamiento con una extensa colección de vídeos. Esto le permite identificar y replicar movimientos, descripciones y cualquier detalle que se le solicite. Así, puede interpretar y visualizar con precisión desde tipos de personas y estilos de vestimenta hasta accesorios y efectos visuales.

Fuente: Youtube

¿Qué es capaz de hacer Sora?

Sora tiene la capacidad de crear escenas complejas con múltiples personajes y puedes definir el tipo de movimientos que desees que realicen. También puedes especificar el entorno, y Sora interpretará tus indicaciones y cómo se representan en el mundo real.

Considera, por ejemplo, el vídeo que te mostraremos a continuación. En este caso, se utilizó un prompt para solicitar la creación de una mujer elegante caminando por una calle de Tokio iluminada por neones y con señalización urbana. En el prompt, también se detallaron aspectos como la vestimenta, sus gafas de sol y su pintalabios.

Sora logra recrear con exactitud a la persona y cómo debe estar vestida, según lo solicitado. Además, captura otros detalles especificados, como que la calle aparezca húmeda y los reflejos tengan un efecto espejo. A continuación, podrás ver el vídeo y, debajo, la traducción del prompt utilizado.

«Una mujer elegante recorre una calle de Tokio, iluminada por neones cálidos y viva señalización urbana. Viste una chaqueta de cuero negra, un vestido largo rojo, botas negras y lleva un bolso a juego. Sus gafas de sol y labios rojos complementan su estilo. Camina con confianza y soltura. La calle, húmeda y brillante, refleja un efecto espejo de las luces multicolores. A su alrededor, numerosos peatones pasean».

Este ejemplo demuestra la capacidad de Sora para captar y reproducir fielmente tus instrucciones. Además, interpreta correctamente el contexto; al situar la acción en Tokio, la mujer exhibe rasgos orientales. Sora te permite también especificar detalles como la edad, la vestimenta y otros atributos físicos, así como los movimientos que realiza.

Como es usual, el éxito al usar Sora depende de la habilidad de cada usuario para elaborar prompts detallados. Una descripción precisa en el prompt resultará en una representación más fiel de lo deseado.

Actualmente, Sora se encuentra en una fase inicial de desarrollo y puede generar vídeos de hasta 60 segundos. Además, la empresa señala que el sistema podría enfrentar dificultades para recrear con precisión ciertas características físicas.

¿Cuándo estará disponible Sora?

Como mencionamos anteriormente, Sora actualmente está en una fase experimental y solo es accesible para investigadores de OpenAI. Por ahora, su uso está restringido a entornos de laboratorio donde se evalúa su desempeño.

OpenAI ha indicado que Sora eventualmente formará parte de su gama de productos. Sin embargo, todavía no se ha establecido una fecha específica para su lanzamiento. La empresa afirma que primero es necesario implementar medidas para asegurar la protección de los usuarios.