fbpx

Google presenta Veo, su generador de videos por IA

El nuevo modelo de generación de videos, Veo, competirá directamente con Sora de OpenAI. Te contamos todo al respecto.

La Google I/O, que se celebró el martes 14 de mayo 2024, resultó ser rica en novedades relacionadas con la IA, eclipsando el lanzamiento de Android 15. La empresa de Mountain View aprovechó este evento anual para detallar su futura experiencia de búsqueda, introducir su nuevo modelo de generación de imágenes y anunciar las últimas noticias sobre su chatbot Gemini.

Google también reveló su nuevo modelo de generación de videos por IA, Veo, destinado a competir directamente con Sora, el modelo anunciado por OpenAI en febrero. Veo estará accesible desde una nueva plataforma e integrado en algunas herramientas de Google.

Veo: Google lanza su modelo de generación de videos

Al igual que su rival Sora, Veo puede producir videos en resolución 1080p a partir de una simple solicitud textual. Según Google, este modelo es capaz de comprender las intenciones del autor, así como el vocabulario específico del mundo del cine.

El modelo ofrece un nivel de control creativo sin precedentes y comprende términos cinematográficos como “timelapse” o “planos aéreos de un paisaje”. Veo crea secuencias homogéneas y coherentes, de modo que las personas, los animales y los objetos se desplazan de manera realista a lo largo de las tomas.

La empresa ya ha establecido colaboraciones con cineastas, como Donald Glover, para explorar las posibilidades que ofrece el modelo. Los primeros extractos presentados son alentadores, aunque aún imperfectos.

Funcionalidades de edición

Google destaca que Veo es el resultado de varios años de trabajo en diversos modelos de video generativos como Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet o Lumiere. Para mejorar el rendimiento de su herramienta, Google utiliza modelos de difusión latentes, que corresponden a representaciones comprimidas y de alta calidad del video. Esto facilita el procesamiento de datos, reduce el tiempo de generación y mejora la calidad al limitar las incoherencias.

Además, Veo permitirá la generación de videos a partir de una imagen y la modificación de áreas específicas de un video existente, integrando por ejemplo nuevos elementos. En el ejemplo a continuación, una imagen generada por IA se puso en movimiento utilizando Veo.

Para asegurar la trazabilidad de los videos, los contenidos generados a través de Veo serán marcados con una marca de agua diseñada con la herramienta propia, SynthID. Los “procesos de verificación de la memorización” también se encargarán de limitar los riesgos relacionados con datos privados y derechos de autor.

VideoFX: una plataforma para crear videos

En el futuro, Veo se integrará en algunos productos de Google, como YouTube Shorts. Desde ayer, el modelo también está accesible en primicia a un número restringido de usuarios en la nueva plataforma VideoFX. Por el momento disponible solo en los Estados Unidos, esta plataforma está equipada con un modo storyboard que permite construir secuencias de video escena por escena:

VideoFX complementa una suite que ya incluye ImageFX, una interfaz dedicada a la generación de imágenes que ofrece acceso al último modelo, Imagen 3, así como MusicFX, diseñada para la creación de música por IA.

Jean-Luc Lenoble
https://www.linkedin.com/in/jeanluclenoble