Application [google gimini AI]
- Conrad Bernadel
- 30 juin
- 1 min de lecture
![Application [google gimini AI]](https://static.wixstatic.com/media/d76136_af9208bf8e6e403cbf132f646dc5841a~mv2.jpg/v1/fill/w_150,h_219,al_c,q_80,usm_0.66_1.00_0.01,blur_2,enc_avif,quality_auto/d76136_af9208bf8e6e403cbf132f646dc5841a~mv2.jpg)
Gemini – Text-to-Image
Gemini, assistant IA multimodal de Google, intègre désormais la génération d’images par texte grâce à son modèle interne et à la famille Imagen développée par DeepMind/Google Brain.
Modèles et fonctionnement
Gemini 2.0 Flash Preview Image Generation : version multimodale capable de générer des images à partir de prompts textuels (format 1024 px)
Imagen 3 et Imagen 4 disponibles via l’API pour des rendus de très haute qualité
Fonctionnalités clés
Text-to-Image & Image Editing : création d’images et retouche via texte (ex. “faire ressembler ce portrait à une peinture”) .
Rendu typographique amélioré : textes rendus fort lisibles dans les images (utile pour stylisation visuelle, affiches) .
Connaissance contextuelle avancée : meilleure compréhension du contenu, des scènes, et des détails réels
Intégration fluide : utilisable via Gemini Apps ou Vertex AI Studio ; requiert responseModalities : ["TEXT","IMAGE"]
En résumé
Élément | Détails |
Modèle principal | Gemini 2.0 Flash + Imagen 3/4 |
Résolution | ~1024 px (peut atteindre plus selon API) |
Capacités | Génération & édition d’images, textes intégrés |
Point fort | Images précises, typographie nette, contextualisation |
Accès | Via Gemini Apps ou Vertex AI (API payante pour Imagen) |
Gemini, en alliant la puissance d’Imagen et sa capacité à générer et modifier des images en conversation, offre une expérience créative fluide, idéale pour illustrer des idées, créer des preview visuelles ou concevoir des visuels textuels stylisés en toute simplicité.