Wenn es einmal nach zehn Uhr abends ist und man dennoch ein Fünkchen Energie in mir wecken will, dann muss man mich nur auf das Gefangenedilemma ansprechen – auf die Gefahr hin, ich dann nicht mehr aufhöre.
1. Das Gefangenendilemma
Das Gefangenendilemma wurde in den 1950er Jahren als Spiel, als Modell erfunden. Die Geschichte dazu lautet so:
Zwei Männer haben gemeinsam ein Verbrechen begangen und sind von der Polizei erwischt worden. Jetzt werden sie getrennt von einander verhört. Die Polizei macht jedem der beiden ein Angebot: Die Männer können schweigen oder alles gestehen. Wenn beide reden, wandern beide für 3 Jahre ins Gefängnis. Wenn beide schweigen, kommen beide für 1 Jahr ins Gefängnis. (Dann hat die Polizei nicht genug Information.) Wenn einer redet und der andere nicht, kommt der frei, der geredet hat (weil der die Schuld auf den anderen schiebt), der andere geht für 5 Jahre ins Gefängnis.
Wie soll man sich als Gefangener entscheiden? Jedem der beiden wäre es lieber, wenn er selber redet und der andere dichthält: 0 Jahre. Das nächstbeste Ergebnis wäre, wenn beide schweigen: 1 Jahr.
Da die beiden Gefangenen unabhängig voneinander verhört werden, beeinflusst die Entscheidung des anderen die eigene nicht. Also macht es Sinn, zu reden: Egal, wie sich der andere verhält, man selber fährt immer besser, wenn man redet. (Kann man leicht nachrechnen: Wenn der andere schweigt, macht es Sinn zu reden, dann kann man nämlich gleich nach Hause gehen. Und wenn der andere redet, ist das eigene Reden auch besser.)
Wenn beide also clevere Burschen sind, führt das dazu, dass beide für 3 Jahre ins Kittchen wandern. Schade, es hätte auch nur 1 Jahr sein können. Trotzdem: Bei einem einmaligen Durchspielen des Gefangenendilemmas ist es tatsächlich sinnvoll, ein fieser Hund zu sein und den anderen zu verraten. Anders sieht es beim wiederholten Gefangenendilemma aus: Wenn dieselben Spieler mehrmals aufeinanderstoßen, kann es sich lohnen, darauf zu hoffen, dass er andere sich gut verhält.
In der allgemeineren Variante werden Punkte verteilt statt Jahre, wobei das Ziel ist, möglichst viele Punkte zu sammeln. Und statt schweigen oder reden spricht man von cooperate oder defect.
Gibt es reale Situationen, die mit dieser einfach Form des Gefangenendilemmas modelliert werden können? Ich weiß es nicht. In Die Evolution der Kooperation von Robert Axelrod (mehr dazu unten) nennt der Autor den Stellungskrieg an unbewegten Fronten im ersten Weltkrieg. Die Heeresleitung hatte mit dem Problem zu kämpfen, dass die Franzosen und die Deutschen absichtlich aneinander vorbeischossen – miteinander kooperierten. Die Lösung bestand darin, die Einheiten regelmäßig auszutauschen, damit eben immer wieder neue Partner miteinander handelten. Douglas R. Hofstadter nennt das Beispiel eines fiktiven Drogenhandels, bei denen der eine Partner am einen Ort die Ware, der andere am anderen Ort das Geld deponiert. Beide könnten versucht sein, zu betrügen.
Weniger dramatisch denke ich mir das manchmal beim Ein- und Aussteigen-Lassen aus der S-Bahn. Ein ähnliches Spiel wird mit den Ks in der Kollegstufe getrieben: Jeder Schüler möchte sich selber ein K nehmen können, wenn er krank ist oder etwas Besseres vorhat als in die Schule zu gehen, möchte aber, dass die anderen Schüler möglichst wenig Ks nehmen, weil der inflationäre Gebrauch der Ks diesen die Glaubwürdigkeit nimmt. Ähnlich auch das Spiel mit dem Internet: 2010 sind die Leitungen verstopft, liest man gerade. Jedem wäre es am liebsten, er selber würde weiter Multimedia nutzen und die anderen darauf verzichten.
Für die letzten Beispiele braucht man sicher andere Modelle als das Gefangenendilemma, allein schon deshalb, weil mehr als zwei Spieler gegeneinander antreten. Die Spieltheorie bietet viele Modelle an; das Gefangenendilemma ist lediglich eines der einfachsten und anschaulichsten, deswegen beschränke ich mich hier darauf. Und weil ich ein Laie bin, der sich nicht wirklich gut auskennt in der Spieltheorie.
2. Das erste Turnier
So. Interessant ist also das iterierte (mit denselben Spielern wiederholte) Gefangenendilemma. Und dazu gibt es tatsächlich auch Turniere. 1979 veranstaltete Robert Axelrod, Politologe an University of Michigan, das erste. 15 Strategien, darunter ein Zufallsprogramm, nahmen Teil. Eine Strategie kann zum Beispiel lauten: Kooperiere immer. Oder: Kooperiere nie. Oder man gibt Quoten vor und setzt auf den Zufall. Oder man sagt: Kooperiere immer, bis du einmal betrogen wirst, danach nie wieder. Oder man sagt: Wenn der Gegenspieler bisher öfter kooperiert hat als nicht, dann koopiere ansonsten nicht. Und das wird dann bei jedem Spiel neu berechnet.
Die 15 Strategien des ersten Turniers bestanden aus 4 bis 77 Zeilen Basic-Code, jede Strategie trat gegen jede andere ungefähr 200 mal an, das ganze Turnier wurde fünfmal wiederholt. Gewonnen sollte die Strategie haben, die die meisten Punkte gemacht hatte.
Einzelheiten kann man bei Robert Axelrod, Die Evolution der Kooperation nachlesen. Das Original erschient 1984, meine deutsche Ausgabe ist von 1988, inzwischen gibt es sichere neuere Werke zum Thema. Der Großteil meiner Informationen in diesem Blogeintrag stammt aus dem Buch von Axelrod.
Die Gewinnerstrategie hieß jedenfalls tit for tat und stammte von Anatol Rapoport, Professor für Philosophie und Psychologie Uni Toronto. Generell stellte sich heraus, dass erfolgreiche Strategien diese zwei Eigenschaften aufwiesen:
* Anständigkeit (eher kooperieren) und
* Nachsichtigkeit (auch mal einee defection des anderen verzeihen.
3. Das zweite Turnier
Bald darauf gab es ein zweites Turnier. Diesmal mit 62 Teilnehmern, mit jeweils 4-152 Zeilen Programmcode. Die teilnehmenden Strategien hatten die Erkenntnisse des 1. Turniers umgesetzt. Es gab jetzt vor allem folgende Strategien:
* die einen achteten darauf, anständig und nachsichtig zu sein
* die anderen spezialisierten sich darauf, anständige und nachsichtige Strategien auszubeuten
Eigentlich naheliegend. Es gab unter beiden Richtungen erfolgreiche Teilnehmer. Wieder gewann tit for tat.
4. Die evolutionäre Variante
Die nächste Stufe war eine Art evolutionäres Turnier. Nach einigen Runden Jeder-gegen-jeden hatte jede Strategie Punkte gesammelt. Je mehr Punkte, desto mehr Exemplare dieser Strategie spielten in der Folgerunde mit. Wer zu wenig Punkte gemacht hatte, starb aus. Und so ging das einige Runden lang. Es stellte sich heraus:
a) Wie erfolgreich eine Stragie ist, hängt von der Umwelt ab. In einer Welt, die nur aus naiven Kooperieren besteht, kann eine fiese Strategie richtig gut absahnen. In einer Welt, die nur aus niemals kooperierenden Strategien besteht, kann eine gemäßigtere Strategie keine Punkte machen. Allerdings reicht schon ein kleiner Prozentsatz an Kooperierern, um diese Stragien stabil zu machen.
b) Die allzu blauäugigen und gutmütigen Strategien starben aus.
c) Danach starben auch die fiesen Strategien aus, weil ihnen die Opfer fehlten.
d) Am erfolgreichsten war wieder: Tit for tat.
5. Und danach?
Tatsächlich blieb tit for tat Jahr um Jahr der Sieger in diesen Turnieren. Erst vor einigen Jahren – ich will gerade nicht nachschlagen – tauchte eine Strategie auf, die noch erfolgreicher war. Eine raffinierte Strategie mit einem interessanten Twist, die allerdings auf tit for tat basierte.
Details dazu und zu tit for tat selber schreibe ich hier nicht. Es macht viel mehr Spaß, das alles selber herauszufinden. Ein guter Startpunkt sind die Links unten. Außerdem habe ich endlich einen guten Grund, lisaneun zu verlinken, die sich auch mit Spieltheorie beschäftigt, in einem Beitrag zum Gefangenendilemma und einem namens: Die Rache.
Im nächsten Kapitel: Das Braess-Paradoxon. Oder vielleicht auch nur Efronsche Würfel.
Nachtrag: Ausführliche Analysen zu Axelrods Turnieren hier.
Nachtrag: Äußerst schöne und erweiterte Gefangenendilemma-Visualisierung, im Browser spielbar (2017).
Schreibe einen Kommentar