GPT-4o erzeugt erschreckend realistische Bilder. c’t 3003 prüft, ob man die neuen KI-Generationen noch entlarven kann. Außerdem: Tipps zum Erkennen.
Bisher waren KI-generierte Bilder oft leicht zu identifizieren, doch die neueste Generation von Bildgeneratoren, wie GPT-4o, schafft erstaunlich realistische Ergebnisse, die sogar Experten verunsichern. Der Moderator von c’t 3003 hat dies praktisch getestet und versucht, unter 20 Bildern 15 von einer KI erstellte zu identifizieren. Im zugehörigen Video werden zudem zwei Tools zur Erkennung von KI-Bildern vorgestellt, ergänzt durch nützliche Tipps und Tricks zur Identifikation.
Transkript des Videos
(Hinweis: Dieses Transkript ist für Personen gedacht, die das Video nicht sehen können oder möchten. Der Text wiedergibt nicht alle visuellen Informationen.)
Wenn das jetzt kein KI-Bild ist, dann stoppen wir das Video sofort und ich suche mir einen neuen Job. Oh, verdammt.
Seht euch dieses Bild an, es ist nicht echt. Und jetzt denkt jeder, klar, KI-Bilder, die erkennt man doch sofort. Man sieht doch, dass das Pedal total kaputt ist. Ja, ja, klar, klar. Ich weiß, dass es eigentlich einfach war, KI-Bilder zu erkennen. Aber schaut euch das hier an. Das wird dann schon schwieriger. Und ich glaube fest daran, dass ich sehr gut und einfach erkennen kann, ob ein Bild echt ist oder von einer KI generiert wurde.
Nach dem großen Update der Bildfunktionen in ChatGPT, also dieses GPT-4o, mit dem jetzt alle möglichen Sachen wie Actionfiguren und Studio-Ghibli-Bilder generieren, bin ich trotzdem noch ziemlich sicher, dass ich erkennen kann, was echt ist und was nicht. Aber das kann man natürlich leicht behaupten. Deshalb hat mein Kollege Lukas mir ein Quiz erstellt mit 15 KI-Bildern, die er mit ChatGPT, genauer gesagt mit dem neuen GPT-4o-Modell, erstellen ließ, und 5 Bilder, die entweder von ihm selbst fotografiert wurden oder aus einer Stockfoto-Datenbank stammen.
Wir machen dieses Quiz jetzt zusammen, also wenn ihr möchtet. Das können wir tatsächlich gemeinsam machen. Bevor wir jedes Bild auflösen, habt ihr fünf Sekunden Zeit, um selbst zu überlegen, ob das Bild von einer KI ist oder echt. Ihr könnt eure Ergebnisse gerne in die Kommentare schreiben. Am Ende des Videos gibt es dann noch einige sehr konkrete Tipps, wie man KI-Bilder erkennen kann. Und wir haben auch zwei Tools zur Erkennung von KI-Fotos getestet. Bleibt dran.
Liebe Hackerinnen und Internet-Surfer, herzlich willkommen hier bei…
Es sind also 15 KI-Bilder und 5 echte. Es könnte sein, dass ich vielleicht einen Fehler mache, aber ich glaube, dass ich die anderen alle erkenne. Ich bin sehr gespannt, muss ich ehrlich sagen.
Oh Gott. Es fängt ja gleich schwierig an, Leute. Verdammt. Oh Gott. Ich hoffe, das ist jetzt gleich das Schwierigste. Die Artifizialität durch die Farben hat natürlich eine gewisse Wirkung. Die Schafe sehen auch alle sehr ähnlich aus, aber nicht zu ähnlich. Und ich versuche jetzt, auf die Gliedmaßen zu achten. Da sehe ich aber nichts Auffälliges. Und an den Schatten sehe ich eigentlich auch nichts Auffälliges. Die sehen für mich irgendwie… Ach ja, ne. Wenn ich nach vorne schaue, dann sieht es irgendwie komisch aus. Ich sage, es ist KI-generiert. Ach. Huh. Puh. Aber extrem, extrem gut. Aber ich glaube, irgendwie sah es ein ganz kleines Bisschen zu perfekt aus.
Ja, da müssen wir gar nicht drüber diskutieren. Oder doch? Hm. Okay, die Frau hat fünf Finger an jeder Hand. Die Banane. Ja, wir haben da… Da ist so eine ganz komische Unschärfe am oberen Teil der Banane. Irgendetwas stimmt da nicht. Auch der Hintergrund ist so komisch. Der ist zu unscharf. Ich meine, die Zähne sind schön unperfekt. Das ist eigentlich etwas, was gegen KI spricht. Ich sage, auch KI. Puh. Huh. Ja, alles klar. Nächstes Bild, bitte.
Oh ja. Nein, noch nicht direkt auflösen. Aber ich sage sofort, das ist kein KI-Bild, weil es so schön unperfekt aussieht. Ich vermute auch, dass das ein Bild ist, das Lukas selbst gemacht hat, weil es ist komisch belichtet. Ich will dich nicht dissen, Lukas. Der Gartenzwerg ist halt so richtig dreckig und unten links guckt da nochmal so ein kleiner Zwerg rein. Es sieht auch richtig schön deutsch aus mit diesem Baumarkt-Lattenzaun da hinten. Also, das ist ein echtes Foto. Von Pixabay, von einem verifizierten Fotografen. Ah, okay.
Leute, da brauche ich gar nicht drüber diskutieren. Also, ich kann jetzt schlecht sagen, warum, aber es ist zu 1000 % ein KI-Bild, weil es eben diese, ich weiß es nicht, diese künstliche Comic-Haftigkeit hat. Auch der Hund, der sieht nicht echt aus, sondern der sieht aus, als wäre der ge-airbrushed oder gerendert oder so. Die Felge da unten sieht irgendwie komisch aus, die Straße sieht auch komisch aus, als wäre die so ein bisschen schief. Also, auf jeden Fall ist es ein KI-Bild. Das hätte mich jetzt wirklich umgehauen.
Und auch hier gilt schon wieder das Gleiche. Also, erstmal habe ich so ein VR-Headset noch nie gesehen und ich kenne mich damit ganz gut aus. Es könnte aber natürlich so ein chinesisches Generic-KI-Headset sein. Also, mein erster Impuls war jetzt sofort: KI-Bild. Wenn ich jetzt länger hingucke, könnte es natürlich auch so ein super krass belichtetes Stockfoto sein, aber ich finde alleine der Hintergrund, was ist denn das auch auf diesem schwarz-weißen Foto da neben der Lampe? Ist das ein Geist oder so? Oder was ist das? Ein Zombie? Das ist irgendwie auch kein Bild, was Oma da auf dem Tisch hat und auch die Lampe sieht falsch aus. Und ich finde auch die Falten von ihr sind nicht richtig. Das ist ein KI-Bild.
Ja, und da direkt der Impuls von mir, das ist ein echtes Bild, weil es ist schief, es ist irgendwie nicht so richtig, es ist schon okay belichtet, aber es sieht einfach aus wie ein Foto, was man so gemacht hat. Ist natürlich wirklich bei dem Foto schwierig, weil es eine Langzeitbelichtung ist, das heißt, der Person in der Mitte rechts, der fehlt ein Bein und auch daneben, das sind halt so Sachen, die durch KI halt passieren, aber ich denke, das ist einfach dem geschuldet, dass das eine Langzeitbelichtung ist. Wenn ich mir allerdings die Fenster und dieses Gebäude da hinten angucke, also ich sage, es ist ein echtes Bild.
Entschuldigung.
Es war mal ein echtes Bild, dann habe ich ChatGPT gesagt, schreibt mir einen Prompt, der dieses Bild so gut beschreibt wie möglich. Und dann habe ich den Prompt in ChatGPT, also in Sora, reingeschrieben und dann den Test daraus gemacht. Einen Fehler habe ich prognostiziert, wenn ich das einmal sagen darf. Okay, nächstes.
Puh. Gut, das ist jetzt halt auch irgendein Tier, wo ich jetzt, also das sieht aus wie, ist das mit Donald Trump verwandt? Das ist halt auch ein Tier, wo ich keine, also mit solchen Tieren habe ich nicht so viel zu tun. Das sieht halt aus wie so ein ganz perfektes Tierbild aus dem Amazonas, was in irgendwelchen Bildbänden drin ist. Ich sage, es ist echt. Ja.
Puh, okay. Ja, okay, das ist, boah ey, Lukas, wirklich herzlichen Glückwunsch, das sind gut ausgewählte Bilder. Also das sieht natürlich extrem Stock-Foto-LinkedIn-Motivationsbild-Shit-mäßig raus. Es sieht nicht falsch aus. Also ich finde interessant, dass diese Slackline, die sieht physikalisch recht korrekt aus, auch wie die sich da um den Baum bindet. Das ist so ein Lederfetzen, der da an der Tasche dranhängt, der eigentlich untypisch ist für solche KI-generierten Sachen. Aber der Hintergrund hat so eine perfekte Unschärfe und so eine uniforme Belichtung. Also der Hintergrund deutet für mich eigentlich auf ein KI-generiertes Bild hin, aber der Vordergrund ist so gut irgendwie. Ich sage, echtes Bild. Fuck. Okay, zweiter Fehler.
Okay, hier bin ich, hier würde ich sehr, also hier würde ich, das ist aber auch krass, das sieht alles sehr echt aus, aber der von seinem linken Schuh sieht aus wie so, wie irgendwas, was nicht aussieht wie ein Schuh und die Socken auch nicht. Also die an den Füßen, also wenn die Füße abgeschnitten gewesen wären, dann hätte ich gesagt, ist ein echtes Foto, aber an den Füßen erkenne ich es KI-generiert.
Okay, das ist natürlich extrem schwierig. Also, sorry, aber das ist, da muss man wirklich raten. Das ist auch KI-generiert. Das ist interessant, weil, kann man da sehen, was da draufsteht? Nee. Also die U-Bahn sieht nicht aus wie irgendeine U-Bahn, die ich schon mal gesehen habe und die Anzeigetafel, pff, ich sage, das ist ein echtes Bild. Ah ja.
Das hier übers Bild, ähm, ja, da, bei dem Bild muss ich, glaube ich, gar nicht so lange überlegen, weil die Fackeln so unecht aussehen, das ist ein KI-Bild. Okay. Ja, und da muss ich auch gar nicht so lange überlegen, dass, man kann schon auf diesen Büchern erkennen, dass das keine richtigen Buchstaben sind, sondern dass das ein komisches Gematsche ist, da hinten, und auch der Bodenbelag sieht komisch aus, der Schattenwurf sieht komisch aus. Das ist auf jeden Fall KI.
Hm. Äh, das ist ein echtes Foto. Das ist, ja, das ist natürlich auch, das ist ein sehr typisches Stockfoto, der Filzhut, das hat was mit Joseph Beuys zu tun, also der Filzhut sieht sehr echt aus, aber es sieht alles echt aus, aber es ist auch zu perfekt. Und ich finde dieser, ähm, dieser Bruchrand des Eis, der, da ist irgendwas komisch, das ist KI-generiert.
Ja, ja, das ist, das ist so, also, da würde ich jetzt direkt 1000 Euro drauf verwetten. Das ist zu Millionen Prozent KI-generiert. Die, die, die Räder sind schief, diese, diese typischen krassen Gesichtsausdrücke, die, die Wand ist auch so krass uniform vollgesprayt. Das ist ja so ein ganz kleines Skateboard, also das ist von der, von den Größenverhältnissen ist das irgendwie auch falsch, also die Beinhaltung von dem hinteren Bein ist falsch, also es ist zu, wenn das jetzt kein KI-Bild ist, dann brechen wir das Video sofort ab und ich suche mir einen neuen Job.
Das ist auch sehr sicher ein KI-Bild, lasst mich einmal ausreden. Da ist, ist nämlich, ist ja wahrscheinlich irgendwie Paris oder so und das soll irgendwie der sechste, wie heißt das, Arrondissement oder so, und da, die Buchstaben sind da falsch. Und auch dieses „Le Rêve de Camille“, die Buchstaben sind auch, die sind schief und die sehen nicht echt aus. Ich finde allerdings das, und auch dieses, dieses Aufgemalte auf dem Schaufenster sieht auch fake aus. Also das ist auch zu 100 Prozent ein KI-Bild.
Bei solchen Bildern, Leute, ist es natürlich echt schwierig, weil die sind jetzt so bewusst artifiziell dekorativ, ne. Das ist, da sind ja wenig Sachen, die man, äh, ja, also, also, ich muss mich ja festlegen, ne. Also das kann halt beides sein, also da erkenne ich jetzt keine typischen KI-Sachen, aber es sieht halt einfach artifiziell aus. Und ich meine, so kann man natürlich aber auch ein echtes Bild, äh, stilisieren, aber ich sag einfach mal KI-Bild.
Okay, next. Krass. Also das Graffiti sieht sehr, sehr echt aus und da da auch so kleine Tags drin sind, sieht sehr gut aus. Aber Lukas, das ist ja aber auch heavily bearbeitet, ne, also wenn es ein echtes Bild wäre, aber gut, okay, ich muss da jetzt mit umgehen. Ähm, auch das ist, das ist schön, das ist unperfekt, da sind so Plastiktüten, die da am Fenster drin sind. Es ist dreckig, es stehen irgendwie so paar kaputte Pflanzen da in dem Fenster, das Graffiti sieht echt aus. Ich würde sagen, das ist ein echtes Foto. Ja. Sehr gut.
Ah ja, okay, äh, das ist zu einem hohen, das ist einfach, es ist ein, einfach ein wahnsinnig perfektes Bild, wo alle, goldener Schnitt und alles stimmt. Ähm, ich, das ist, also der Mann sieht gut aus, aber die Bienen sind zu groß und zu scharf zum Teil. Ist auch ein KI-Bild. Ja.
Zwei falsch? Zwei falsch. Okay, ja gut. Ich habe echt Angst gehabt, mich hier zu blamieren. Ich habe gesagt, dass ich eins nicht erkenne, ich habe jetzt zwei Fehler gemacht, aber bei 20 Bildern kann ich mit leben, aber auf jeden Fall erstaunlich gut ausgewählt und ich denke, in einem Jahr wird mir das nicht mehr so leicht fallen. Da können wir das ja nochmal ausprobieren, ob das in einem Jahr immer noch so gut funktioniert.
Ja, und ihr habt ja in meinen Erklärungen auch schon ein paar Sachen gesehen, worauf ich geachtet habe in den Fotos. Wir haben jetzt noch ein paar Tipps und Tricks zusammengestellt, mit denen ihr einigermaßen zuverlässig KI-generierte Bilder erkennen könnt, auch wenn die auf den ersten Blick natürlich fotorealistisch wirken.
Und es gibt ja auch inzwischen viele Tools, die KI-generierte Bilder erkennen können. Um Bilder kostenfrei und ohne Anmeldung zu überprüfen, könnt ihr zum Beispiel Illuminati verwenden. Da ladet ihr ein Bild hoch und bekommt dann die Wahrscheinlichkeit angezeigt, ob das jetzt KI ist oder nicht. Allerdings hat das Tool so seine Problemchen mit den neuen Bildern von GPT-4o, also den Bildern aus ChatGPT.
Mit dem kostenpflichtigen Tool „AI or Not“ knapp 90 % der Bilder aus ChatGPT hat „AI or Not“ richtig als KI-generiert erkannt. Bei einigen Bildern hatte das Tool aber auch seine Probleme.
Ja, also dafür kostet dieses Tool allerdings auch 9 Dollar pro Monat oder 60 Dollar im Jahr. Es gibt dafür aber auch sogar eine Anzeige, mit welchem KI-Modell das Bild wahrscheinlich erstellt wurde. Das neue Modell von ChatGPT, GPT-4o, ist allerdings bei „AI or Not“ noch nicht integriert. Das heißt, die Bilder werden zwar als KI-generiert erkannt, aber es wird noch nicht angezeigt, was das für ein Modell ist.
Aber generell, und das ist auch noch ein weiterer Tipp, kann sich das auch lohnen, einfach die Datei sich mal anzugucken. Da ist nämlich in den Metadaten, steht da zum Beispiel drin, dass das Bild direkt aus einer Kamera kommt. Das steht da. Also zum Beispiel das Kameramodell oder auch das Objektiv oder so. Und wenn es in Sora generiert wurde, ist das auch in den Metadaten vermerkt. Wenn man allerdings über ChatGPT
Ähnliche Artikel
- Retrogaming-Revolution: So simulieren Sie Röhren-TV-Unschärfe auf Flachbildfernsehern!
- Spektakulär: Pferderennen, magische Schneeflocken & Unterwasserwelten – Top Bilder der Woche!
- Neuer Thermomix TM7 im Test – Revolution in der Küche? | c’t 3003
- Erlebt: Wie sich ein Waymo-Robotaxi unter Zeitdruck fährt!
- Fitness-Geheimnisse von Mr. Universum: Wie ein 65-Jähriger in Top-Form bleibt!

Experte für Popkultur und Filmfan, erkundet Max Jäger die Welt der Unterhaltung mit neugierigem und lockerem Blick. Er teilt gerne die Geschichten hinter den Stars und entschlüsselt die Trends, die die Medienlandschaft prägen.





