Algorithmen

KI-Fotos: Das Lächeln aus dem Computer

Der Bedarf an Fotos in der Werbe­indus­trie und den Medien ist quasi unend­lich groß. Wenn es darum geht, den Nach­schub an möglichst unver­brauchten Motiven zu stillen, machen Algo­rithmen den mensch­lichen Models Konkur­renz.
Von dpa /

Die Zukunft: Computergenerierte Model-Fotos können selbst nach diversen Kriterien erstellt werden. Die Zukunft: Computergenerierte Model-Fotos können selbst nach diversen Kriterien erstellt werden.
Bild: generated.photos / Screenshot: teltarif.de
"Tracey aus Florida" läuft den Strand entlang und lächelt für den Werbe­spot in die Kamera. "Präsi­dent Trump macht einen wunder­baren Job. Ich könnte mir keinen besseren Präsi­denten der Verei­nigten Staaten von Amerika vorstellen", sagt eine Stimme aus dem Off. In einem anderen Werbe­video sieht man auch einen optisch eher unge­wöhn­lichen Trump-Fan: "Thomas aus Washington". Mit Hipster-Bart und bunten Tattoos lehnt er hinter dem Tresen einer Bar, während aus dem Off ein Loblied auf Trump gesungen wird.

Dass es sich bei "Tracey" und "Thomas" nicht um echte Trump-Supporter handelt, stellte sich schnell heraus. Es handelte sich nicht einmal um gebuchte Schau­spieler, sondern um Prot­agonisten aus einer Stock­bild­datei, in der Video­sequenzen auf Vorrat liegen. "Tracey" lief nicht an der Küste Floridas entlang, sondern an einem Mittel­meer-Strand. Und Hipster "Thomas" bediente seine Gäste nicht in Washington, sondern in Tokio. Und beide Akteure hatten nach Recher­chen von CNN keine Ahnung, dass sie in den Wahl­kampf­spots für Trumps Face­book-Seite eine tragende Rolle spielen sollten. Die Zukunft: Computergenerierte Model-Fotos können selbst nach diversen Kriterien erstellt werden. Die Zukunft: Computergenerierte Model-Fotos können selbst nach diversen Kriterien erstellt werden.
Bild: generated.photos / Screenshot: teltarif.de

Porträt eines echten Menschen oder aus dem Computer?

Künftig können sich die Betrachter von Werbe­spots sogar nicht mehr sicher sein, ob die gezeigten Personen über­haupt exis­tieren. Zumin­dest bei Fotos fällt schon heute der Unter­schied schwer, ob es sich um Porträts von Menschen handelt oder um Bilder, die voll­ständig in einem Computer produ­ziert wurden.

Man kann das schnell selbst auspro­bieren: Auf der Website whichfaceisreal.com stellen zwei Profes­soren der Univer­sity of Washington, Jevin West und Carl Berg­strom, Tausende virtu­elle Porträts in einem Vergleich echten Fotos gegen­über. Der User kann mit einem Klick entscheiden, welches Bild eine reale Person zeigt und welches einen KI-Repli­kanten. Rund sechs Millionen Runden wurden von einer halben Million Menschen gespielt. Bei etli­chen Motiven aus dem Computer meinte über die Hälfte der Spieler, es handele sich um ein echtes Porträt.

Das Gene­rieren von künst­lichen Gesich­tern ist aber längst keine akade­mische Finger­übung mehr: Jetzt erregt das US-Unter­nehmen Gene­rated Media mit einem riesigen Katalog von künst­lich gene­rierten Porträts große Aufmerk­samkeit. Die Firma stellte vor gut einer Woche 100 000 Bild­dateien unter der Adresse generated.photos zum Herun­terladen bereit, die für private Zwecke kostenlos genutzt werden dürfen. "Wir sind begeis­tert von der Reso­nanz auf unser 100K Faces Project, und auch ein wenig über­wältigt", schrieb Firmen-Manager Tyler Lasto­vich in einem Blogein­trag.

Soft­ware-Paket "StyleGAN" von Nvidia verwendet

Bei "Gene­rated Photos" kommt wie bei dem Uni-Projekt aus Washington das Soft­ware-Paket "StyleGAN" des US-Chip­giganten Nvidia zum Einsatz, das unter einer freien Lizenz veröf­fent­licht wurde. Wie bei so vielen Projekten in der Künst­lichen-Intel­ligenz-Forschung brauchte es mensch­lichen Input, um das System anzu­lernen. Nvidia bediente sich bei Flickr, um über 70 000 frei verfüg­bare Bilder von echten Menschen als Trai­nings­mate­rial herun­terzu­laden. Nach Angaben von Firmen­gründer Ivan Braun wurden für das Projekt "Gene­rated Photos" weitere 29 000 Bilder von 69 Models ausge­wertet, die Firmen­foto­grafen aufge­nommen hatten.

Experten gehen davon aus, dass in wenigen Jahren nicht nur Fotos von KI-Repli­kanten gene­riert werden können, sondern komplette Videos. "Wir denken, dass wir das weiter voran­treiben können, indem wir nicht nur Fotos, sondern auch 3D-Bilder erzeugen, die in Compu­terspielen und Filmen verwendet werden können", sagte Jaakko Leht­inen auf dem KI-Lab von Nvidia in Finn­land der "New York Times".

Die Forscher kehren dabei das Prinzip der Objekt­erken­nung mit einem komplexen Algo­rithmus, der als neuro­nales Netz­werk bezeichnet wird, um. Bei den neuro­nalen Netz­werken kann das System durch das Iden­tifi­zieren gemein­samer Muster lernen, dass es sich um ein mensch­liches Gesicht handelt. Der Kniff war, dem System beizu­bringen, diese Muster zu verwenden, um eigene Bilder von "mensch­lichen" Gesich­tern zu erstellen. In einem Wett­bewerb von zwei neuro­nalen Netz­werken strengt sich das eine System an, das andere System zu über­tölpeln und ein gene­riertes Bild als echtes Porträt vorzu­täuschen. Das andere System versucht wiederum, sich nicht täuschen zu lassen.

Unechte Bilder momentan teils noch gut zu erkennen

Bei vielen KI-Porträts, die von dem System als "echt" durch­gewunken werden, fällt es dem mensch­lichen Auge jedoch noch leicht, die Fälschung zu erkennen, etwa an unna­türlich erschei­nenden Haar­strähnen, merk­würdigen Haut-Texturen oder unsym­metrisch erschei­nenden Augen. Es ist aber nur eine Frage der Zeit, bis die KI-Systeme so gut trai­niert sind, dass solche Fehler besei­tigt werden.

Die Auswir­kungen auf den Markt der Bild­agen­turen, die Fotos auf Vorrat anbieten, scheinen vorher­sehbar: "Diese KI-gene­rierten Leute werden die Stock­foto­grafie killen", prognos­tiziert das Busi­ness-Portal "Fast Company". Firmen, die für kommer­zielle Zwecke Porträt­fotos benö­tigen, können nämlich demnächst über eine tech­nische Schnitt­stelle (API) die gewünschten Krite­rien wie Alter, Geschlecht, Hautton und Stim­mung vorgeben - und erhalten dann die entspre­chenden Bilder aus dem System.

Mehr zum Thema Medien