Reproduction d’Image par IA : ChatGPT vs Grok vs Mistral vs Google Gemini vs DeepSeek vs Claude vs Midjourney – Qui Fait Mieux ?
Imaginez que vous trouviez une illustration magnifique et que vous vous demandiez : « Est-ce que l’IA peut la reproduire avec précision ? » C’est exactement la question que je me suis posée.
📷 Peut-on Fidèlement Recréer une Image avec l’IA ?
Alors, dans un élan de curiosité geek, j’ai mis à l’épreuve les grandes IA du moment pour voir qui se débrouillait le mieux dans l’art délicat de la transcription et de la régénération visuelle.
🧪 Le Protocole de Test : Même Image, Même Demande, IA Différentes
Pour ce test, j’ai utilisé une image illustrée et soumis la même requête aux différentes IA. L’idée était de leur demander de décrire l’image aussi précisément que possible, afin de générer un prompt textuel optimisé pour une recréation via Midjourney.
Mon prompt :
by @Lady_Luminous |
Can you describe this image to generate a text prompt that I can use to recreate it using generative AI? I need details about the model, background, style, and any extra information that will allow me to recreate it as closely as possible to the original result. Can you help me? |
Et voici ce que chaque IA m’a proposé…
🔍 Comparaison des Descriptions Générées par IA
1️⃣ ChatGPT : Un Conteur Poétique
Prompt généré :
« A magical and serene forest scene at twilight, featuring a young woman with long red hair sitting on the grass. She wears a flowing teal-blue dress adorned with delicate floral patterns, accessorized with a tiara and ornate jewelry… »
✅ Forces : Très détaillé, style narratif immersif.
❌ Faiblesse : Manque d’indications sur la technique artistique (ex. : vintage, années 60).
2️⃣ Mistral AI : Une Vision Très Contée
Prompt généré :
« Create a whimsical, fantasy-themed illustration in a vibrant, detailed style reminiscent of fairy tale art. The central figure is a young woman with long, flowing red hair adorned with a delicate tiara… »
✅ Forces : Très détaillé et structuré, met l’accent sur l’ambiance magique.
❌ Faiblesse : Ajoute des détails non présents dans l’image (comme l’or sur la robe).
3️⃣ Grok : L’Essentiel, mais Manque un Petit Plus
Prompt généré :
« A young woman with long, flowing red hair, wearing a blue floral-patterned dress, sits in a magical forest at night. She has a serene expression and is gently holding a white rabbit… »
✅ Forces : Décrit bien la scène générale.
❌ Faiblesse : Moins précis que ChatGPT et Mistral, manque un peu de texture et de détails.
4️⃣ Claude : Sobre et Inspirant
Prompt généré :
« The image depicts a whimsical fantasy scene in a vibrant, illustrative style. The central figure is a young woman with long, flowing red hair and a crown-like headdress, shown embracing a large white rabbit… »
✅ Forces : Une description qui capte bien l’ambiance.
❌ Faiblesse : Moins riche en détails que ChatGPT et Mistral.
5️⃣ Midjourney : Concis et Direct
Prompt généré :
« A beautiful woman in an iridescent blue dress sits on the ground and caresses her white rabbit under the moonlight, surrounded by colorful flowers, mushrooms, and trees… »
✅ Forces : Court et efficace, bon équilibre entre concision et détails.
❌ Faiblesse : Moins descriptif que les autres IA.
6️⃣ Google Gemini & DeepSeek : Échec Critique ❌
- Google Gemini : « Sorry, I can’t help with images of people yet. »
- DeepSeek : Ne peut pas analyser et générer de description détaillée.
🙅 Verdict : Ces IA sont hors compétition pour ce test, mais elles brillent dans d’autres domaines.
🎨 Analyse des Résultats Visuels Après Génération Midjourney
🚀 Les points communs entre les IA :
✔️ La structure générale de l’image est bien captée. Toutes les IA ont bien repris la femme aux cheveux rouges, le lapin blanc et l’ambiance magique.
✔️ Les éléments narratifs sont respectés. Les descriptions parlent toutes d’un univers enchanteur, avec des champignons, des fleurs et une forêt mystique.
📉 Les différences majeures :
❌ Le style visuel d’origine n’a pas été totalement respecté. L’image de base avait un rendu vintage, un peu années 50-60, ce que seule Grok et (dans une moindre mesure) ChatGPT ont capté.
❌ Des ajouts et oublis notables. Certains prompts incluent des éléments qui ne sont pas dans l’image originale (comme l’or sur la robe avec Mistral).
⭐ Les meilleurs résultats visuels :
1️⃣ Claude & Mistral ont généré des prompts qui donnent une belle reproduction, avec un aspect onirique marqué.
2️⃣ ChatGPT a bien décrit l’ambiance, mais aurait pu affiner la technique artistique.
3️⃣ Midjourney a été trop succinct, mais efficace.
🔥 Conclusion : Quelle IA Gagne la Bataille ?
🥇 🏆 Meilleure IA pour la fidélité de la description : ChatGPT & Mistral.
🥈 ✨ Meilleure IA pour le rendu artistique : Claude.
🥉 💡 Meilleure IA pour l’équilibre concision/précision : Grok.
💡 Si l’objectif est d’affiner la génération d’images, il faudrait croiser plusieurs IA. Utiliser un mix de ChatGPT + Mistral pour générer un bon prompt, puis affiner avec des corrections basées sur l’analyse stylistique.
Et vous, laquelle auriez-vous choisi ? Testez par vous-même et partagez vos résultats ! 🎨🚀
Source
Image original proviens d’un rendu flux sur Civitae.green by @Lady_Luminous
https://civitai.green/user/Lady_Luminous
ChatGPT vs Grok vs Mistral AI vs Google Gemini vs DeepSeek vs Claude vs Midjourney
Pas de commentaire