OpenAI, creador de ChatGPT y del generador de imágenes DALL-E, presentó una nueva herramienta llamada «Sora», capaz de crear, a partir de una simple instrucción en texto, videos con calidad cinematográfica de hasta un minuto de duración, una innovación revolucionaria en el campo de la inteligencia artificial.
Creado en base a las búsquedas anteriores en los modelos DALL-E y ChatGPT, esta nueva platafor?ma está todavía en fase de prueba, precisó este jueves la start-up californiana aliada a Microsoft, que presentó algunos videos para mostrar sus primeros avances.
Qué es Sora y cómo funciona
Según los primeros avances compartidos por Open IA en su web y luego difundidos masivamente en la red social «X», esta tecnología puede crear clips de hasta un minuto de duración «con calidad visual y respetando la demanda del usuario».
Sora puede «generar escenas complejas con varios personajes, movimientos específicos y detalles precisos», indicó la empresa.
También permite crear un video a partir de una imagen fija, asegura el gigante de la inteligencia artificial (IA). Asimismo, tiene la capacidad de alargar videos ya existentes.
Sam Altman, número uno de OpenAI, publicó en su cuenta de X que Sora será ofrecida «a un número limitado de creadores el acceso», en el marco de una etapa experimental.
También invitó a los usuarios a hacer propuestas para generar videos, tras lo cual difundió algunos ejemplos.
Entre estos videos, pueden verse imágenes de dos perros subiendo por la nieve en una montaña. Otro clip muestra cómo un animal imaginario comienza a volar ante un magnífico atardecer. En su lomo monta un hámster con ropa deportiva.
Sora es una base para «programas capaces de comprender y simular el mundo real», explica la start-up, que espera que esta sea una «etapa importante en la concreción de la AGI», la Inteligencia Artificial General, un sistema altamente autónomo que superaría a los humanos en la mayoría de las tareas económicamente rentables.
Por su parte, OpenAI adviertió que el «actual modelo» de la plataforma presenta «defectos», como una confusión entre izquierda y derecha o la imposibilidad de mantener una continuidad visual durante toda la extensión del video.
«Por ejemplo, una persona puede comer una galleta, pero luego, la galleta puede no exhibir una mordedura», ejemplificó.
La compañía afirmó que la seguridad es un asunto clave en este desarrollo y afirmó que organizará simulaciones con usuarios a los que se les pedirá tratar de provocar errores o crear contenido inapropiado, para poder definir mejor los límites de la plataforma.
«Involucraremos a tomadores de decisiones políticas, educadores y artistas en el mundo para comprender sus preocupaciones e identificar los casos positivos de uso de esta nueva tecnología», aseguró OpenAI.
Meta, Google y Runway AI, que trabajan en aplicaciones similares, conocidas como «text-to-video», es decir que permiten pasar una idea escrita a video, también presentaron muestras de sus avances.
Los guionistas de Hollywood, en pie de guerra con la inteligencia artificial
En mayo del 2023, la meca del cine estadounidense se detuvo por completo. Los guionistas empezaron una huelga, a la que se sumaron a mediados de julio los actores, para pedir una mejor remuneración y una regulación del uso de la inteligencia artificial (IA).
Esta protesta inédita en Hollywood desde 1960 terminó en septiembre en el caso de los guionistas, que consiguieron un acuerdo salarial y protecciones frente al uso de la IA.
Los actores, preocupados por el temor de que los estudios recurran a la tecnología para clonar su voz y su imagen para reutilizarlas a perpetuidad sin compensación ni consentimiento, retomaron los rodajes en noviembre.
Además de las mejores salariales, la huelga consiguió imponer restricciones en el uso de la IA.
La producción de películas y series estadounidenses quedó paralizada durante casi seis meses por la protesta, que costó al menos 6.000 millones de dólares a la economía del país.