Ich glaube, ich habe für das Erstellen von Bildern noch nie die Dialogform gewählt. Das kommt heute gleich mal dran. Ich benutze ChatGPT 5.1.
„Erstelle ein Gemälde von der Mona Lisa, so wie sie als junge moderne Frau heute aussehen würde. Damit das Bild meinen Vorstellungen entspricht, stelle mir mindestens fünf Fragen zur Umsetzung, bevor du beginnst, das Bild zu erzeugen.“
Die Antwort von ChatGPT kommt prompt:
„Gerne! Bevor ich das Gemälde erstelle, stelle ich dir mindestens fünf gezielte Fragen, damit das Ergebnis genau deinen Vorstellungen entspricht:
Alter & Erscheinung: Wie alt soll die „moderne Mona Lisa“ ungefähr sein, und welche Merkmale (Haarfarbe, Frisur, Gesichtszüge) wünschst du dir? Kleidung & Stil: Soll die junge Mona Lisa moderne Alltagskleidung tragen (z. B. Jeans, T-Shirt), etwas Elegantes (z. B. Kleid, Blazer) oder eher modisch-künstlerisch wirken? Setting / Hintergrund: Soll der Hintergrund an das Original erinnern (mystische Landschaft) oder ein modernes Setting haben (Stadt, Café, Studio, neutraler Hintergrund)? Malstil: Bevorzugst du eine moderne Interpretation im Ölgemäldestil, eine fotorealistische Darstellung, eine Mischung aus klassisch + modern, oder etwas ganz anderes? Stimmung & Ausdruck: Soll sie – wie im Original – ein geheimnisvolles Lächeln zeigen, oder wünschst du einen anderen Ausdruck (selbstbewusst, ernst, fröhlich, nachdenklich)? Bildformat: Soll das Bild hochformatig wie das Original sein oder quadratisch / quer?
Wenn du möchtest, kann ich dir danach auch noch weitere Detailfragen stellen, um das Ergebnis weiter zu verfeinern.
Ich freue mich auf deine Antworten!“
Meine Antworten lauten:
„Zu Frage 1: Die moderne Mona Lisa soll von Alter und Aussehen Ihrem Vorbild entsprechen.
Zu Frage 2: Sie soll Alltagskleidung der Gegenwart tragen, also T-Shirt und Jeans. Das T-Shirt soll im Stil eines Band-Shirts gestaltet sein und sich auf Ludwig van Beethoven beziehen.
Zu Frage 3: Der Hintergrund soll dem Original entsprechen.
Zu Frage 4: Der Malstil soll dem Original von Leonardo Da Vinci entsprechen.
Zu Frage 5: Stimmung und Ausdruck sollen dem Original entsprechen.
Zu Frage 6: Das Bildformat soll wie im Original hochformatig sein.“
Und das hier war dann der nächste Schritt von ChatGPT:
„Perfekt — danke für die klaren Antworten!
Bevor ich das Bild generiere, brauche ich eine letzte wichtige Rückfrage, um sicherzugehen, dass die Darstellung eindeutig und für eine Bild-KI korrekt umsetzbar ist:
Letzte Frage zur Feinabstimmung:
Wie modern darf ihr Erscheinungsbild wirken?
Möglich sind z. B.:
Sehr nah am Original – gleiche Gesichtszüge, Frisur leicht modernisiert (sanfte Wellen, natürliche Farben), dezentes Make-up. Deutlich moderner Look – klar modernere Frisur (z. B. glattes Haar, leichter Pony), feines Make-up, aber weiterhin eindeutig als „Mona Lisa“ erkennbar. Komplett heutiger Look – typische moderne Frisuren, Accessoires (z. B. Ohrringe, dezente Kette), insgesamt stärker zeitgenössisch, aber Gesichtszüge an die Mona Lisa angelehnt.
Welche Variante bevorzugst du?
Wenn du möchtest, kannst du noch angeben, ob Schmuck, Tätowierungen, Piercings oder ganz ohne gewünscht sind.
Sobald ich diese letzte Info habe, erstelle ich sofort das Gemälde.“
Ich: „Ich bevorzuge Variante 1, nahe am Original.“
Und hier das erste Ergebnis.

ChatGPT: „Hier ist dein gewünschtes Gemälde — die moderne Mona Lisa, möglichst nah am Original, aber als junge Frau von heute mit Beethoven-Bandshirt, Jeans, Original-Hintergrund und Leonardo-Malstil.
Wenn du Anpassungen möchtest (andere T-Shirt-Farbe, stärker modernisierte Frisur, mehr Details, Variation der Pose), mache ich dir gern weitere Varianten.
Soll ich Version 2 oder eine Nahaufnahme, eine sattere Ölfarb-Textur oder eine größere Datei erzeugen?“
Ich: „Erstelle mir bitte eine Variante mit einer modernen Frisur und einem modernen Accessoire in Form von AirPods in den Ohren.“
Und dann kam Bild 2.

Ich finde, beide Bilder sind toll geworden und haben meine Intentionen sehr gut umgesetzt.
Ohne den Zeitaufwand gemessen zu haben glaube ich, dass die Dialogform nicht länger dauert, als einen komplexen Prompt zu durchdenken und zu schreiben.



