top of page
ARTprenti quand l'ART rencontre l'apprentissage

Application [google gimini AI]

Application [google gimini AI]

Gemini – Text-to-Image



Gemini, assistant IA multimodal de Google, intègre désormais la génération d’images par texte grâce à son modèle interne et à la famille Imagen développée par DeepMind/Google Brain.


Modèles et fonctionnement

  • Gemini 2.0 Flash Preview Image Generation : version multimodale capable de générer des images à partir de prompts textuels (format 1024 px)

  • Imagen 3 et Imagen 4 disponibles via l’API pour des rendus de très haute qualité


Fonctionnalités clés

  • Text-to-Image & Image Editing : création d’images et retouche via texte (ex. “faire ressembler ce portrait à une peinture”) .

  • Rendu typographique amélioré : textes rendus fort lisibles dans les images (utile pour stylisation visuelle, affiches) .

  • Connaissance contextuelle avancée : meilleure compréhension du contenu, des scènes, et des détails réels 

  • Intégration fluide : utilisable via Gemini Apps ou Vertex AI Studio ; requiert responseModalities : ["TEXT","IMAGE"]


En résumé

Élément

Détails

Modèle principal

Gemini 2.0 Flash + Imagen 3/4

Résolution

~1024 px (peut atteindre plus selon API)

Capacités

Génération & édition d’images, textes intégrés

Point fort

Images précises, typographie nette, contextualisation

Accès

Via Gemini Apps ou Vertex AI (API payante pour Imagen)


Gemini, en alliant la puissance d’Imagen et sa capacité à générer et modifier des images en conversation, offre une expérience créative fluide, idéale pour illustrer des idées, créer des preview visuelles ou concevoir des visuels textuels stylisés en toute simplicité.

Comments


bottom of page