Application [google gimini AI]

Conrad Bernadel
30 juin 2025
1 min de lecture

Gemini – Text-to-Image

Gemini, assistant IA multimodal de Google, intègre désormais la génération d’images par texte grâce à son modèle interne et à la famille Imagen développée par DeepMind/Google Brain.

Modèles et fonctionnement

Gemini 2.0 Flash Preview Image Generation : version multimodale capable de générer des images à partir de prompts textuels (format 1024 px)
Imagen 3 et Imagen 4 disponibles via l’API pour des rendus de très haute qualité

Fonctionnalités clés

Text-to-Image & Image Editing : création d’images et retouche via texte (ex. “faire ressembler ce portrait à une peinture”) .
Rendu typographique amélioré : textes rendus fort lisibles dans les images (utile pour stylisation visuelle, affiches) .
Connaissance contextuelle avancée : meilleure compréhension du contenu, des scènes, et des détails réels
Intégration fluide : utilisable via Gemini Apps ou Vertex AI Studio ; requiert responseModalities : ["TEXT","IMAGE"]

En résumé

Élément	Détails
Modèle principal	Gemini 2.0 Flash + Imagen 3/4
Résolution	~1024 px (peut atteindre plus selon API)
Capacités	Génération & édition d’images, textes intégrés
Point fort	Images précises, typographie nette, contextualisation
Accès	Via Gemini Apps ou Vertex AI (API payante pour Imagen)

Gemini, en alliant la puissance d’Imagen et sa capacité à générer et modifier des images en conversation, offre une expérience créative fluide, idéale pour illustrer des idées, créer des preview visuelles ou concevoir des visuels textuels stylisés en toute simplicité.

Gemini – Text-to-Image

2 commentaires