Application [google gimini AI]
- Conrad Bernadel
- 30 juin
- 1 min de lecture
![Application [google gimini AI]](https://static.wixstatic.com/media/d76136_af9208bf8e6e403cbf132f646dc5841a~mv2.jpg/v1/fill/w_832,h_1216,al_c,q_85,enc_avif,quality_auto/d76136_af9208bf8e6e403cbf132f646dc5841a~mv2.jpg)
Gemini – Text-to-Image
Gemini, assistant IA multimodal de Google, intègre désormais la génération d’images par texte grâce à son modèle interne et à la famille Imagen développée par DeepMind/Google Brain.
Modèles et fonctionnement
Gemini 2.0 Flash Preview Image Generation : version multimodale capable de générer des images à partir de prompts textuels (format 1024 px)
Imagen 3 et Imagen 4 disponibles via l’API pour des rendus de très haute qualité
Fonctionnalités clés
Text-to-Image & Image Editing : création d’images et retouche via texte (ex. “faire ressembler ce portrait à une peinture”) .
Rendu typographique amélioré : textes rendus fort lisibles dans les images (utile pour stylisation visuelle, affiches) .
Connaissance contextuelle avancée : meilleure compréhension du contenu, des scènes, et des détails réels
Intégration fluide : utilisable via Gemini Apps ou Vertex AI Studio ; requiert responseModalities : ["TEXT","IMAGE"]
En résumé
Élément | Détails |
Modèle principal | Gemini 2.0 Flash + Imagen 3/4 |
Résolution | ~1024 px (peut atteindre plus selon API) |
Capacités | Génération & édition d’images, textes intégrés |
Point fort | Images précises, typographie nette, contextualisation |
Accès | Via Gemini Apps ou Vertex AI (API payante pour Imagen) |
Gemini, en alliant la puissance d’Imagen et sa capacité à générer et modifier des images en conversation, offre une expérience créative fluide, idéale pour illustrer des idées, créer des preview visuelles ou concevoir des visuels textuels stylisés en toute simplicité.
Comments