On a testé Gemini Omni : le Nano Banana vidéo de Google
On a testé Gemini Omni : le Nano Banana vidéo de Google

On a testé Gemini Omni : le Nano Banana vidéo de Google

On a testé Gemini Omni : le Nano Banana vidéo de Google

On a passé une journée à tester Gemini Omni, la nouvelle IA vidéo de Google annoncée à Google I/O 2026. Présenté officiellement comme le « Nano Banana de la vidéo » et déployé pour remplacer Veo dans l’application Gemini, ce modèle accepte image, son, vidéo et texte en entrée et génère des clips de 10 secondes par conversation. Notre test, ce qu’il vaut vraiment et le tuto complet pour s’en servir.

Qu’est-ce que Gemini Omni ?

Gemini Omni est le nouveau modèle multimodal de Google annoncé lors de la keynote Google I/O 2026 le 19 mai. Présenté par Koray Kavukcuoglu, CTO de Google DeepMind et Chief AI Architect de Google, il est décrit comme un modèle capable de « créer n’importe quoi à partir de n’importe quelle entrée, en commençant par la vidéo ».

La comparaison avec Nano Banana n’est pas un hasard. L’année dernière, Nano Banana avait transformé la génération d’images chez Gemini avec son approche conversationnelle. Omni applique exactement la même logique à la vidéo. Vous donnez une instruction en langage naturel, le modèle exécute, vous affinez par la conversation.

Gemini Omni vs Veo : quelles différences ?

La question revient partout depuis l’annonce. Gemini Omni Flash remplace effectivement Veo dans l’application Gemini, mais ce n’est pas qu’un changement de nom. Trois différences majeures.

L’édition conversationnelle multi-tours. Avec Veo, vous générez une vidéo à partir d’un prompt unique. Avec Omni, vous générez une vidéo puis vous lui demandez de la modifier en continu : « change le décor », « ajoute un personnage », « change l’angle de caméra ». Chaque instruction s’enchaîne en conservant la cohérence de la scène, ce qui n’était pas possible avec Veo.

L’entrée multimodale combinée. Omni accepte une combinaison d’image, d’audio, de vidéo et de texte dans la même requête. Veo gérait essentiellement le texte vers vidéo et l’image vers vidéo.

La cohérence physique et temporelle. Selon Google, Omni s’appuie sur la connaissance du monde de Gemini pour respecter la physique (gravité, fluides, énergie cinétique) et garder les personnages cohérents d’un plan à l’autre. C’est l’une des grosses limites des modèles vidéo IA jusqu’ici.

Éditer ses vidéos par la conversation avec Gemini Omni

Le point central de Gemini Omni est l’édition vidéo en langage naturel. Vous pouvez modifier une scène existante en discutant avec le modèle. Chaque instruction s’ajoute à la précédente sans perdre la cohérence des personnages, de la physique ou de l’environnement.

On a testé Gemini Omni : le Nano Banana vidéo de Google

Les démos officielles présentées par Google montrent une sculpture qui se transforme en bulles, un bras qui devient miroir liquide au contact d’une surface, des fenêtres qui s’allument en rythme avec une musique ou encore une bille qui parcourt un circuit Rube Goldberg avec une physique réaliste. Tout ça à partir d’une seule vidéo de référence et de prompts texte.

Gemini Omni accepte image, son, vidéo et texte en entrée

Gemini Omni se distingue par sa polyvalence multimodale. Vous pouvez combiner une image, un fichier audio, une vidéo et du texte dans une même requête. Le modèle fusionne ces références pour produire une vidéo cohérente de 10 secondes maximum par clip.

Le support audio en entrée se limite pour l’instant aux références vocales (pour la fonction Avatar) que je n’ai pas essayé. Google a indiqué que d’autres types d’audio (musique, ambiances) seraient pris en charge prochainement.

Avatar Gemini Omni : créer son double numérique

Omni embarque une fonction Avatar qui crée une version numérique de l’utilisateur. Vous fournissez une photo et une voix, le modèle génère ensuite des vidéos qui vous ressemblent et qui parlent avec la voix de votre choix (je n’ai pas essayé d’y mettre la mienne).

On a testé Gemini Omni : le Nano Banana vidéo de Google

Une fonction qui ouvre la porte à de nombreux usages créatifs mais qui est encadrée par des règles de modération strictes côté Google pour limiter les détournements.

On a testé Gemini Omni : le Nano Banana vidéo de Google

Toutes les vidéos générées par Gemini Omni intègrent le watermark SynthID de Google. Invisible à l’œil nu, ce marquage permet de vérifier qu’une vidéo a été générée par IA via l’app Gemini, Gemini dans Chrome ou la recherche Google.

On a testé Gemini Omni : le Nano Banana vidéo de Google

Où et comment utiliser Gemini Omni

Gemini Omni Flash est déployé depuis le 19 mai 2026 pour les abonnés Google AI Plus, Pro et Ultra. Vous y accédez via plusieurs canaux :

  • L’application Gemini (web et mobile)
  • Google Flow, l’outil de création vidéo de Google Labs
  • YouTube Shorts et l’application YouTube Create (gratuitement)

Une API pour les développeurs et les entreprises arrivera dans les prochaines semaines selon le blog officiel Google. Les générations sont limitées à 10 secondes de vidéo par clip pour le moment.

Gemini Omni en pratique : notre test

On a testé Gemini Omni Flash sur Google Flow avec une vidéo de référence basique : 10 secondes d’un homme qui marche dans son jardin. Le modèle a permis de remixer la scène en yéti dans la montagne, en magicien de Donjons et Dragons, en personnage de jeu vidéo rétro pixelisé ou encore en homme qui marche sur l’eau. La démarche, les mouvements et le visage restent reconnaissables d’une version à l’autre, ce qui était le point faible des modèles précédents. Vous pouvez comparer 12 exemples basés sur notre vidéo de base.

On a testé Gemini Omni : le Nano Banana vidéo de Google
On a testé Gemini Omni : le Nano Banana vidéo de Google
On a testé Gemini Omni : le Nano Banana vidéo de Google
On a testé Gemini Omni : le Nano Banana vidéo de Google

Il y a aussi des bruitages qui sont générés ou encore des paroles selon votre demande. Par un exemple ci-dessous, je lui ai demandé de me transformer en look années 80 et de chanter

On a testé Gemini Omni : le Nano Banana vidéo de Google

On peut aussi lui demander de faire des changements de caméra.

On a testé Gemini Omni : le Nano Banana vidéo de Google

Deux observations à retenir après cette session de test. D’abord, les prompts les plus simples donnent les meilleurs résultats. Surcharger la consigne avec des détails cinématographiques produit souvent des glitches. Une phrase courte et claire suffit dans la plupart des cas.

On a testé Gemini Omni : le Nano Banana vidéo de Google

Ensuite, les générations consomment du crédit rapidement. Nous on a fait plus beaucoup plus de 20 tests. À garder en tête avant de lancer une batterie de tests.

Tuto vidéo Gemini Omni étape par étape

On a réalisé un tuto vidéo complet pour montrer comment utiliser Gemini Omni dans Google Flow. Au programme : accéder au modèle Omni dans l’interface, importer une vidéo de référence de 10 secondes, choisir les bons réglages, écrire des prompts qui fonctionnent vraiment, tester la fonction Avatar avec une photo personnelle et identifier les glitches récurrents à éviter. Le tout en moins de 11 minutes.

FAQ Gemini Omni

Gemini Omni est-il gratuit ?

Gemini Omni Flash est gratuit sur YouTube Shorts et l’application YouTube Create. Pour y accéder via l’app Gemini ou Google Flow, il faut un abonnement Google AI Plus, Pro ou Ultra.

Comment accéder à Gemini Omni ?

Trois points d’entrée principaux : l’app Gemini (web et mobile) pour les abonnés Google AI, Google Flow pour la création vidéo avancée, et YouTube Shorts pour un accès gratuit limité. Une API arrivera dans les prochaines semaines pour les développeurs.

Quelle est la différence entre Gemini Omni et Veo ?

Gemini Omni Flash remplace Veo dans l’app Gemini. Les principales différences : édition conversationnelle multi-tours, entrée multimodale combinée (image + audio + vidéo + texte dans une même requête) et meilleure cohérence physique et temporelle des scènes.

Combien de temps peut faire une vidéo générée par Gemini Omni ?

Les clips générés par Gemini Omni Flash sont limités à 10 secondes maximum pour le moment. Pour des séquences plus longues, il faut générer plusieurs clips et les assembler en post-production.

Comment créer son avatar IA avec Gemini Omni ?

La fonction Avatar de Gemini Omni demande une photo et une voix de référence. Le modèle crée ensuite un double numérique qui peut être inséré dans n’importe quelle vidéo générée et qui parle avec votre voix. La fonction est accessible dans Google Flow et dans l’app Gemini.

Les vidéos générées par Gemini Omni sont-elles identifiables ?

Oui. Toutes les vidéos créées avec Gemini Omni intègrent le watermark SynthID de Google. Ce marquage est invisible à l’œil nu mais détectable via l’app Gemini, Gemini dans Chrome ou la recherche Google.

Gemini Omni est-il meilleur que Seedance 2 ?

Difficile à trancher après quelques jours seulement. Les premiers retours pointent une meilleure cohérence des personnages et de la physique chez Omni grâce à la connaissance du monde de Gemini.