Künstliche Intelligenz

Neue Studie zeigt: KI generiert erstmals bessere Gedichte als Menschen

Stand
Autor/in
Anja Braun
Anja Braun, Reporterin und Redakteurin SWR Wissen aktuell.
Richard Kraft

Eine neue Studie hat gezeigt, dass Künstliche Intelligenz nicht nur täuschend echte Gedichte generieren kann, sondern sie auch als besser und harmonischer empfunden werden.

Podcast-Gespräche, Musik oder Witze – Künstliche Intelligenz ist offenbar in der Lage, täuschend echte Kunst zu generieren. Künstlich erzeugte Gemälde oder Gesichter werden sogar eher als echt anerkannt als das menschliche Pendant. Eine neue Studie hat nun gezeigt: Auch Lyrik beherrscht die KI mittlerweile besser als wir Menschen. 

In der Studie, die jetzt in Scientific Reports veröffentlicht wurde, wollte Studienleiter Brian Porter testen, ob Menschen zwischen KI-generierter Poesie und der eines menschlichen Dichters unterscheiden können. Messen musste sich die KI mit namhaften Künstlern wie Shakespeare, Lord Byron, T.S. Eliot und Sylvia Plath. 

Probanden haben die Gedichte der KI als menschlicher empfunden  

Jedem der 1.634 Teilnehmenden wurden zehn Gedichte präsentiert. Aus einer Auswahl an bekannten Dichtern wurden fünf Gedichte nach dem Zufallsprinzip für jeden Probanden ausgewählt. Die anderen fünf Gedichte wurden von der KI ChatGPT 3.5 verfasst und sollten dem Stil der Dichterin oder des Dichters entsprechen. Wichtig war den Forschenden, dass keiner der Teilnehmenden eine tiefere Expertise auf dem Gebiet der Lyrik hatte und auch nicht regelmäßig Gedichte las. 

Zu jedem der zehn Gedichte wurden die Probanden befragt: Ist das Werk KI-generiert oder menschengemacht? Es kam heraus, dass vier der fünf Gedichte, die am häufigsten als menschlich bewertet wurden, künstlicher Natur waren. Die fünf Gedichte, die in diesem Ranking am seltensten als menschlich eingestuft wurden, waren dagegen alle von echten Dichterinnen und Dichtern. 

Person korrigiert Text. KIs können ein besseres Gedicht verfassen als menschliche Dichter.
In einem Experiment waren Teilnehmende nicht in der Lage ein Gedicht von einer KI mit einem menschengemachten Texten zu unterscheiden. Die Gedichte von der KI wurden sogar als besser und harmonischer bewertet.

Teilnehmende empfanden KI-Gedichte als einfacher und zugänglicher 

In einem zweiten Experiment bewertete eine andere Gruppe von 696 Teilnehmenden die Gedichte auf Merkmale wie Qualität, Schönheit, Emotion, Rhythmus und Originalität. Dabei beurteilten die Teilnehmenden KI-generierte Gedichte durchweg positiver als die von Menschen geschriebenen.  

Die Studienautoren vermuten, dass die Teilnehmenden KI-Gedichte auch deshalb bevorzugten, weil sie einfacher und zugänglicher waren als die Werke der prominenten Dichterinnen und Dichter. So bewerteten die Teilnehmenden echte von Menschen verfasste Gedichte weit häufiger mit der Aussage: „macht keinen Sinn“ als KI-Gedichte.

Buch von Goethe. Die KI reiht sich ein neben den großen Lyrikern der Menschheit. In einem Experiment konnten Teilnehmende KI-generierte Texte nicht von menschlichen Gedichten unterscheiden.
Die KI reiht sich ein neben den großen Lyrikern der Menschheit. In einem Experiment konnten Teilnehmende KI-generierte Texte nicht von menschlichen Gedichten unterscheiden.

Wenige Menschen trauen einer KI gute Gedichte zu  

Auch die Erwartungshaltung spielte eine Rolle. So gingen die Teilnehmenden davon aus, dass ihnen von Menschen geschriebene Gedichte sicher besser gefallen würden. Aber sie bevorzugten die leichter verständlichen KI-generierten Gedichten. Ihre eigene Vorliebe dafür interpretierten sie dann fälschlicherweise als Beweis für menschliche Autorschaft. 

Dabei gingen die Teilnehmenden davon aus, dass eine KI gar nicht in der Lage sein kann, Gedichte zu produzieren, die ihnen mindestens so gut gefallen wie von Menschen geschriebene Gedichte. Doch die Ergebnisse zeigen, dass diese Erwartung falsch ist. 

Bisher konnte Künstliche Intelligenz poetisch noch nicht überzeugen 

Nach Ansicht der Forschenden zeigt das einen großen Fortschritt in der Leistungsfähigkeit der generativen KI. Poesie war bisher einer der wenigen Bereiche, in denen KI-Modelle noch nicht das Niveau erreicht hatten, dass man die Ergebnisse auch für menschlich erzeugt halten konnte. 

So konnten Menschen die Poesie des KI Vorgängermodells GPT2 noch ziemlich zuverlässig von Menschen geschriebener Poesie unterscheiden. Bei der Poesie von ChatGPT-3.5 ist das nicht mehr möglich. Das Autorenteam fordert daher, umfassende Vorschriften zur Transparenz beim Einsatz von KI-Systemen umzusetzen.