Como hacer vida artificial espectacular con Sora

En primer lugar quiero pediros que disculpeis a Mac, dijo que esperaba no ver un post sobre IA’s en algún tiempo. Pero la actualidad manda y aunque este short se publique ahora, se escribió al día siguiente de saltar la noticia. Como hacer vida artificial espectacular con Sora es el titular, pero viene como anillo al dedo.
El pasado 15 de febrero OpenAI dueña de ChatGPT DALL·E y DALL·E 3 lanzó una nueva aplicación que va a revolucionar el mercado de las inteligencias artificiales. Debido a que no está a disposición del público, este short se basará en mi opinión y en extractos de la página oficial.
Presentamos Sora, nuestro modelo de texto a vídeo. Sora puede generar videos de hasta un minuto de
extraído de la página oficial de Sora
duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario.
Solo el equipo rojo tiene acceso libre a esta aplicación en estos momentos para evaluar daños, riesgos y áreas críticas. Para hacer avanzar al modelo se están otorgando permisos a cineastas, artista visuales y diseñadores (nosotros no estamos entre ellos jajajaja).
Estamos compartiendo el progreso de nuestra investigación desde el principio para comenzar a trabajar y recibir
extraído de la página oficial de Sora
comentarios de personas ajenas a OpenAI y para brindarle al público una idea de las capacidades de IA que hay en el horizonte.

Como funciona Como hacer vida artificial espectacular con Sora
El funcionamiento de esta aplicación no difiere mucho de las muchas existentes, es más, simplemente hace falta escribir. La complejidad y realismo de las imágenes es simplemente impresionante, nadie diría que los videos son artificiales.
Una de las características que anuncian es que Sora comprende como lo pedido por el usuario sería en la vida real. Los detalles de personajes, paisajes o fondos son tan realistas como si se hubiese grabado con una cámara de video.
Otra característica muy apreciada, es la posibilidad de crear múltiples tomas en un mismo video, manteniendo el estilo y la narrativa visual. También es justo mencionar que en la página de Sora la empresa reconoce que aún se generan fallos.
Al estar en fase de pruebas, puede confundir detalles de los mensajes que se escriben al detallar escenas. «…darle un mordisco a una galleta y que la galleta no tenga la marca de dicho mordisco«.
extraído de la página oficial de Sora
Han subido 48 videos de ejemplo según la característica que explican, incluso en la sección de errores.
El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.
extraído de la página oficial de Sora
Aviso: Este primer plano de un camaleón muestra sus sorprendentes capacidades de cambio de color.
texto descriptivo de video superior
El fondo está borroso, lo que llama la atención sobre la llamativa apariencia del animal.
Seguridad
Una de las cosas más importantes es la seguridad, en todos los aspectos. En malas manos puede crear caos y confusión y en esta era de las noticias falsas, pues….. No hace mucho salio una imagen de Donald Trump detenido por la policía (era falsa por supuesto) generada con inteligencia artificial.
Si una imagen es potente, imaginad un video…. esto es lo que la compañía dice que quiere evitar pero ya sabemos que casi nunca lo cumplen, ninguna de ellas. Quizás su intención sea buena y facilitar el trabajo a artistas o gente corriente pero….. en fin sería una discusión eterna, ya me comprendéis.
…estamos creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video.
extraído de la página oficial de Sora
…no podemos predecir todas las formas beneficiosas en que las personas utilizarán nuestra tecnología, ni todas las formas en que abusarán de ella.
extraído de la página oficial de Sora
Tecnología
Sora se desarrolla gracias a la experiencia adquirida en otros productos de OpenAI, como sus hermanos ChatGPT, DALL·E o DALL·E 3. Algo que aseguran sus creadores (y no lo voy a poner en duda) es que será capaz de generar un video a partir de una imagen fija. Esto sí es novedad y no lo de Microsoft Designer ☚que analizamos la semana pasada en este blog.
Además, aseguran que podra generar fotogramas perdidos en un video o ampliarlo con nuevas secuencias aleatorias y coherentes. Para los que entiendan los tecnicismos nos dejan leer su informe técnico, yo me fiare de sus palabras jajajaja.
Conclusión
Muchísimos medios de comunicación se han hecho eco del anuncio de OpenIA y casi todos concuerdan…. es realmente increíble y da miedo el realismo que consigue esta aplicación. Estaremos atentos a las novedades y os la contaremos por aquí.
De momento me despido de vosotros hasta el próximo post, no sin antes agradeceros vuestro tiempo, un saludo y nos vemos en los bares!!!!