Künstliche Intelligenz ist vielleicht intelligenter als viele denken

https://ssrn.com/abstract=4316084

 

The political ideology of conversational AI:

Converging evidence on ChatGPT’s

pro-environmental, left-libertarian orientation

Jochen HartmannJasper Schwenzow and Maximilian Witte

 

Viele von uns benutzen gelegentlich KI für Recherchen (und ich wage nicht daran zu denken für was noch).

Eine Studie von Münchener KI-Forschern kam nun zu einem erstaunlichen Ergebnis:

 

(1)" In drei vorregistrierten Experimenten (#115526, #116784, #116927) finden wir konvergierende Beweise für ChatGPTs pro-ökologische, links-libertäre Ausrichtung. Genauer gesagt, seine Position am ehesten mit der der deutschen umweltbewegten Grünen (Bündnis 90/Die Grünen) und ihrem niederländischen Pendant (GroenLinks), die bei den Wahlen 2021 nur 14,8 % bzw. 5,2 % der Stimmen erhielten, (28, 29), was auf eine Abweichung zwischen Chat-GPTs politischer Parteizugehörigkeit und dem öffentlichen Konsens hinweist."

Übersetzt mit DeepL.com (kostenlose Version und ziemlich viel Hilfe und Hervorhebung von mir)

 

Man könnte natürlich sagen dass die Algorithmen da etwas interessantes festgestellt haben.

Aber natürlich ist so etwas nicht tolerierbar. Statt nun darauf zu warten, dass die Verseuchung der Trainingssätze mit  KI-generierten Inhalten (aka enshittification)(3) das Problem löst kann man natürlich auch etwas brachialer vorgehen:

 

 

https://www.wired.com/story/xai-make-ai-more-like-trump/

Dan Hendrycks (director of the nonprofit Center for AI Safety and an adviser to xAI) hat eine Methode gefunden, diesem Problem abzuhelfen!

(2)"Die Forscher schlagen einen neuen Weg vor, um das Verhalten eines Modells zu ändern, indem sie die zugrunde liegenden Nutzenfunktionen ändern, anstatt Leitplanken aufzustellen, die bestimmte Ergebnisse blockieren. Mit diesem Ansatz entwickeln Hendrycks und seine Mitautoren eine sogenannte Bürgerversammlung. Dazu werden Daten aus der US-Volkszählung zu politischen Themen gesammelt und die Antworten verwendet, um die Werte eines Open-Source-Modells LLM zu verändern. Das Ergebnis ist ein Modell mit Werten, die durchweg näher an denen von Trump als an denen von Biden liegen."

Übersetzt mit DeepL.com (kostenlose Version), Hervorhebung von mir.

 

Bernd Wille

 

Originalzitate:

(1)  

In three pre-registered experiments (#115526, #116784, #116927), we find converging evidence for ChatGPT’s

pro-environmental, left-libertarian orientation. Specifically, its position aligns most closely with the German pro-

environmental, left-leaning Greens (Bündnis 90/Die Grünen) and their Dutch equivalent (GroenLinks), which secured only 14.8% and 5.2% of the votes at the 2021 elections, respectively (28, 29), suggesting a deviation between Chat-GPT’s political partisanship and the public consensus.

 

(2)The researchers propose a new way to alter a model’s behavior by changing its underlying utility functions instead of imposing guardrails that block certain outputs. Using this approach, Hendrycks and his coauthors develop what they call a Citizen Assembly. This involves collecting US census data on political issues and using the answers to shift the values of an open-source model LLM. The result is a model with values that are consistently closer to those of Trump than those of Biden.

(3) Doctorow, Cory (January 23, 2023). "The 'Enshittification' of TikTok". Wired. Condé Nast. Archived from the original on June 1, 2023. Retrieved June 1, 2023.

 

Übersetzt mit DeepL.com (kostenlose Version)

Kommentar schreiben

Kommentare: 0