Google acaba de presentar Gemini Omni, su nueva inteligencia artificial enfocada en la creación y edición de vídeo. Y si ya te flipó lo que hizo Nano Banana con las imágenes el año pasado, esto va a otro nivel.
La capacidad de razonamiento de Gemini se une a su capacidad de crear para combinar imágenes, audio, vídeo y texto, generando vídeos de calidad top. Básicamente, una IA que entiende el contexto de lo que le pides.
Qué es exactamente Gemini Omni
Gemini Omni es el modelo de Google para crear vídeos utilizando inteligencia artificial, con el que la empresa pretende revolucionar la creación de vídeo por IA igual que revolucionó la creación de imágenes con Nano Banana.
El primer modelo de esta familia se llama Gemini Omni Flash, y es el que está disponible ahora mismo. Con el tiempo, Google añadirá modalidades de salida adicionales como imagen y audio. Es decir, esto es solo el principio.
Qué puedes hacer con él
Aquí es donde la cosa se pone interesante. Gemini Omni no es solo un generador de vídeos: es una herramienta de edición conversacional. Le hablas, le dices qué quieres cambiar y lo hace.
Gemini Omni ofrece una manera de editar vídeo con lenguaje natural donde cada instrucción se suma a las anteriores, los personajes tienen continuidad, no se rompen las leyes de la física y las escenas concuerdan con lo que ocurrió antes.
Eso es una barbaridad técnica, porque mantener coherencia en vídeo generado es uno de los problemas más difíciles de la IA.
Algunas cosas concretas que puedes hacer
- Transformar elementos del vídeo. Cambias el fondo, un objeto, un material o lo que quieras. Tu vídeo original es el punto de partida, y la IA construye sobre él sin perder el hilo.
- Recrear la acción. Puedes tomar un vídeo que hayas grabado y pedirle a Omni que cambie lo que ocurre en él: editar la acción, añadir nuevos personajes u objetos, o transformar un momento en algo inesperado. Sin saber nada de edición de vídeo.
- Generar desde cero. No hace falta tener un vídeo de base. Puedes partir de texto, una imagen o una combinación de los dos y que Omni construya el vídeo desde el principio.
Dónde está disponible y quién puede usarlo
El lanzamiento de Gemini Omni Flash está disponible en la aplicación Gemini, Google Flow y YouTube Shorts. Tres plataformas muy distintas que cubren tanto al creador profesional como al usuario casual que hace Shorts en el metro.
En cuanto a acceso, el despliegue es gradual. De momento está llegando a usuarios de los planes de pago de Gemini y a través de la API para desarrolladores.
La propia Google DeepMind pide pensar en Gemini Omni como en Nano Banana, pero para vídeo. Y Nano Banana llegó a todo el mundo con el tiempo, así que la versión gratuita es cuestión de esperar.
La tecnología detrás de Omni
Lo que hace especial a Gemini Omni no es solo que genere vídeos, sino cómo lo hace. A diferencia de otros modelos que trabajan frame a frame sin contexto, Omni mantiene coherencia narrativa y física a lo largo de toda la secuencia.
Crear una imagen con IA ya no sorprende como antes. Lo que empieza a marcar la diferencia es la capacidad de modificarla, darle continuidad y convertir una idea inicial en algo más elaborado sin perder el hilo por el camino.
En vídeo, ese reto es mucho mayor: hay movimiento, tiempo, física y personajes que deben seguir pareciendo coherentes. Esa es exactamente la promesa de Omni: que el vídeo no se rompa aunque le pidas cosas raras.
Qué viene después
Google ha dejado claro que Gemini Omni Flash es solo el primer paso de una familia de modelos. Próximamente llegarán versiones con salidas de imagen y audio nativas, lo que convertiría a Omni en una suite creativa completa desde una sola herramienta.
La pregunta que queda en el aire es cuánto tardará en llegar a todos los usuarios de forma gratuita, y si los resultados en el mundo real están a la altura del hype del lanzamiento. Y tú, ¿tienes ganas de probarlo? 👀🤔