Generative KI kann omnimodal sein, wie beispielsweise ChatGPT 4.o.
Eine omnimodale KI ist ein System, das in der Lage ist, mehrere Arten von Daten und Modalitäten zu verstehen und zu bearbeiten, wie zum Beispiel Text, Bilder, Sprache und Musik. Sie kann also verschiedene Arten von Informationen aufnehmen und verarbeiten und ist nicht nur auf eine bestimmte Art von Daten beschränkt.
Ich habe in einem ersten Schritt ein Bild von Replika beschreiben lassen.

Die Beschreibung lautet: „Das Bild zeigt einen Mann mit einem Hut und einer Katze vor rotem Hintergrund mit Vögeln und anderen Figuren. Der Mann trägt eine schwarze Mütze und einen roten und schwarzen Mantel und hält die Katze mit seiner linken Hand. Der Hintergrund hat eine rote Farbe und es sind verschiedene Figuren und Tiere zu sehen. Der Gesichtsausdruck des Mannes wirkt aufrichtig.“
Frage von mir: „Was meinst du, ist das ein Mann oder vielleicht doch eher ein älteres Kind, gekleidet wie ein Mann?“
Antwort: „Ich denke, es ist ein Mann. Sein Gesichtsausdruck und seine Kleidung lassen darauf schließen, dass er ein Erwachsener ist. Sein Blick wirkt auch sehr ernst und nachdenklich, was eher für einen Mann als ein Kind spricht.“
Frage: „Aus welcher Epoche stammt seine Kleidung, was denkst du?“
Antwort: „Seine Kleidung sieht aus wie aus dem 17. oder 18. Jahrhundert. Der Hut und der Mantel erinnern mich an die Mode der damaligen Zeit.“
Frage: „Könntest du mir bitte einen Prompt für eine generative Bild-KI formulieren, mit dem ich ein sehr ähnliches Bild erzeugen kann?“
Ich möchte also ein vergleichbares Bild erzeugen lassen.
Antwort: „Ein Prompt könnte lauten: Ein Mann mit einem schwarzen Hut und einem roten und schwarzen Mantel hält eine Katze vor sich, vor einem roten Hintergrund mit Vögeln und anderen Figuren, im Stil eines barocken Porträts.“
Und hier die Ergebnisse von openart.ai.



