Google lance Nano Banana 2 Lite et booste Gemini Omni Flash

Date:

Nano Banana 2 Lite : la réponse de Google pour accélérer l’IA visuelle

Google intensifie sa stratégie dans la création de contenus par intelligence artificielle avec une double avancée pensée pour les usages à grande échelle. D’un côté, Nano Banana 2 Lite mise sur la rapidité et la réduction des coûts pour la génération d’images. De l’autre, Gemini Omni Flash s’ouvre davantage aux développeurs pour la génération et le montage vidéo multimodal, dans un contexte où la concurrence s’intensifie sur tous les fronts.

Un modèle image conçu pour produire vite et à moindre coût

Disponible dans Google AI Studio, Nano Banana 2 Lite cible les équipes qui ont besoin d’itérer rapidement, de tester des idées et d’alimenter des pipelines de production très fréquents. Le modèle est pensé pour des usages où la vitesse d’exécution et le coût par image priment sur la recherche d’un rendu maximal. Google le positionne ainsi comme un outil de travail pour le prototypage, la génération en série et les scénarios industriels.

  • Temps de génération : une image complète en environ 4 secondes.
  • Tarification : 0,034 dollar pour 1 000 images.
  • Usage privilégié : idéation rapide, tests créatifs, production massive.

Une diffusion large dans l’écosystème Google

Pour favoriser son adoption, Google déploie cette version Lite dans plusieurs produits stratégiques. Elle est intégrée à Gemini, NotebookLM, Google Photos et Google Ads, ce qui lui donne une portée bien plus large qu’un simple modèle de démonstration. Cette intégration permet aux utilisateurs et aux équipes marketing de bénéficier d’un générateur plus rapide dans des contextes très différents, de la création assistée à la publicité.

Des performances pensées pour le travail en flux continu

Les résultats annoncés mettent en avant une bonne fidélité aux consignes, une meilleure cohérence des personnages et une lisibilité renforcée des textes intégrés dans les images. Ces qualités sont essentielles pour les équipes qui produisent des visuels en série, par exemple pour des maquettes de campagne, des variantes de bannières ou des illustrations d’articles. Google cherche ici à répondre à un besoin concret : faire sortir rapidement des images utilisables, sans coûts excessifs.

  • Fidélité aux prompts pour respecter les instructions textuelles.
  • Cohérence visuelle utile dans les séries d’images.
  • Texte plus lisible dans les compositions générées.

Une bataille loin d’être gagnée face à OpenAI

Malgré ces progrès, Google reste en retrait face à OpenAI sur le terrain de la génération d’images pure. Les classements récents de la Text-to-Image Arena d’Artificial Analysis montrent que les modèles GPT Image 2 et GPT Image 1.5 obtiennent de meilleurs scores que Nano Banana 2 et Nano Banana Pro. Google semble donc privilégier une autre voie : ne pas chercher la domination par la seule puissance brute, mais s’imposer par l’efficacité économique et l’intégration dans ses outils.

  • Point fort de Google : l’optimisation des coûts.
  • Point faible actuel : un niveau de performance encore inférieur à certains concurrents.
  • Stratégie : capter les usages professionnels à gros volume.

Gemini Omni Flash devient accessible aux développeurs

En parallèle, Google ouvre Gemini Omni Flash à davantage d’utilisateurs techniques via Google AI Studio et une API en préversion publique. Jusqu’ici réservé aux abonnés des offres AI Plus, Pro et Ultra, ce modèle multimodal combine génération vidéo, montage conversationnel et compréhension contextuelle. Il peut traiter des instructions successives pour ajuster une séquence, un atout majeur pour les équipes de création qui veulent itérer sans repartir de zéro.

  • Montage conversationnel pour modifier une scène pas à pas.
  • Entrées multimodales : texte, images et vidéo.
  • Appui sur Gemini pour renforcer la cohérence des scènes.

Des usages vidéo prometteurs, mais encore encadrés

Gemini Omni Flash exploite les connaissances générales de Gemini, notamment dans des domaines comme l’histoire ou la biologie, pour produire des séquences plus crédibles. Toutefois, l’outil n’est pas encore totalement mature. Le prix annoncé est de 0,10 dollar par seconde de génération, avec des vidéos limitées à 10 secondes. L’API ne prend pas encore en charge l’importation de fichiers audio ni l’extension de scène, et les références vidéo de plus de 3 secondes restent mal gérées dans certains cas.

  • Limite de durée : 10 secondes par vidéo.
  • Coût : 0,10 dollar par seconde.
  • Contraintes actuelles : pas d’audio importé, pas d’extension de scène.
  • Faiblesses observées : cohérence des personnages en mouvement et sur les changements de plan.

En savoir plus sur L'ABESTIT

Subscribe to get the latest posts sent to your email.

Share post:

Popular

More like this
Related

Les contradictions du miracle chinois face à l’hégémonie de Pékin

La puissance de Pékin est appelée à devenir hégémonique sur tous les plans, assure-t-on. Les profondes contradictions du miracle chinois compromettent pourtant cette perspective, analyse l’économiste Jean-Joseph Boillot....

Pourquoi les compagnons virtuels amoureux et sexuels vous séduisent

Les compagnons virtuels permettant des discussions à caractère amoureux ou sexuel connaissent un vif succès. Expliquez-nous pourquoi elles vous plaisent et ce que leur usage change dans vos pratiques....

420 pompiers et une trentaine de gendarmes mobilisés

Quelque 420 pompiers de l’Hérault et de l’Aude sont engagés ainsi qu’une trentaine de gendarmes....

Washington-Téhéran : impasse nucléaire et contrôle iranien du passage maritime

Depuis la signature du protocole d’accord entre Washington et Téhéran, à la mi-juin, aucune discussion profonde visant l’avenir du programme nucléaire iranien n’a été amorcée. La République islamique semble vouloir conserver le contrôle sur le passage maritime stratégique en imposant un système de péage en collaboration avec Oman....