Das Gefangenendilemma

By | 1.12.2007

Wenn es einmal nach zehn Uhr abends ist und man dennoch ein Fünkchen Energie in mir wecken will, dann muss man mich nur auf das Gefangenedilemma ansprechen – auf die Gefahr hin, ich dann nicht mehr aufhöre.

1. Das Gefangenendilemma

Das Gefangenendilemma wurde in den 1950er Jahren als Spiel, als Modell erfunden. Die Geschichte dazu lautet so:

Zwei Männer haben gemeinsam ein Verbrechen begangen und sind von der Polizei erwischt worden. Jetzt werden sie getrennt von einander verhört. Die Polizei macht jedem der beiden ein Angebot: Die Männer können schweigen oder alles gestehen. Wenn beide reden, wandern beide für 3 Jahre ins Gefängnis. Wenn beide schweigen, kommen beide für 1 Jahr ins Gefängnis. (Dann hat die Polizei nicht genug Information.) Wenn einer redet und der andere nicht, kommt der frei, der geredet hat (weil der die Schuld auf den anderen schiebt), der andere geht für 5 Jahre ins Gefängnis.

Wie soll man sich als Gefangener entscheiden? Jedem der beiden wäre es lieber, wenn er selber redet und der andere dichthält: 0 Jahre. Das nächstbeste Ergebnis wäre, wenn beide schweigen: 1 Jahr.

Da die beiden Gefangenen unabhängig voneinander verhört werden, beeinflusst die Entscheidung des anderen die eigene nicht. Also macht es Sinn, zu reden: Egal, wie sich der andere verhält, man selber fährt immer besser, wenn man redet. (Kann man leicht nachrechnen: Wenn der andere schweigt, macht es Sinn zu reden, dann kann man nämlich gleich nach Hause gehen. Und wenn der andere redet, ist das eigene Reden auch besser.)

Wenn beide also clevere Burschen sind, führt das dazu, dass beide für 3 Jahre ins Kittchen wandern. Schade, es hätte auch nur 1 Jahr sein können. Trotzdem: Bei einem einmaligen Durchspielen des Gefangenendilemmas ist es tatsächlich sinnvoll, ein fieser Hund zu sein und den anderen zu verraten. Anders sieht es beim wiederholten Gefangenendilemma aus: Wenn dieselben Spieler mehrmals aufeinanderstoßen, kann es sich lohnen, darauf zu hoffen, dass er andere sich gut verhält.

In der allgemeineren Variante werden Punkte verteilt statt Jahre, wobei das Ziel ist, möglichst viele Punkte zu sammeln. Und statt schweigen oder reden spricht man von cooperate oder defect.

Gibt es reale Situationen, die mit dieser einfach Form des Gefangenendilemmas modelliert werden können? Ich weiß es nicht. In Die Evolution der Kooperation von Robert Axelrod (mehr dazu unten) nennt der Autor den Stellungskrieg an unbewegten Fronten im ersten Weltkrieg. Die Heeresleitung hatte mit dem Problem zu kämpfen, dass die Franzosen und die Deutschen absichtlich aneinander vorbeischossen – miteinander kooperierten. Die Lösung bestand darin, die Einheiten regelmäßig auszutauschen, damit eben immer wieder neue Partner miteinander handelten. Douglas R. Hofstadter nennt das Beispiel eines fiktiven Drogenhandels, bei denen der eine Partner am einen Ort die Ware, der andere am anderen Ort das Geld deponiert. Beide könnten versucht sein, zu betrügen.
Weniger dramatisch denke ich mir das manchmal beim Ein- und Aussteigen-Lassen aus der S-Bahn. Ein ähnliches Spiel wird mit den Ks in der Kollegstufe getrieben: Jeder Schüler möchte sich selber ein K nehmen können, wenn er krank ist oder etwas Besseres vorhat als in die Schule zu gehen, möchte aber, dass die anderen Schüler möglichst wenig Ks nehmen, weil der inflationäre Gebrauch der Ks diesen die Glaubwürdigkeit nimmt. Ähnlich auch das Spiel mit dem Internet: 2010 sind die Leitungen verstopft, liest man gerade. Jedem wäre es am liebsten, er selber würde weiter Multimedia nutzen und die anderen darauf verzichten.
Für die letzten Beispiele braucht man sicher andere Modelle als das Gefangenendilemma, allein schon deshalb, weil mehr als zwei Spieler gegeneinander antreten. Die Spieltheorie bietet viele Modelle an; das Gefangenendilemma ist lediglich eines der einfachsten und anschaulichsten, deswegen beschränke ich mich hier darauf. Und weil ich ein Laie bin, der sich nicht wirklich gut auskennt in der Spieltheorie.

2. Das erste Turnier

So. Interessant ist also das iterierte (mit denselben Spielern wiederholte) Gefangenendilemma. Und dazu gibt es tatsächlich auch Turniere. 1979 veranstaltete Robert Axelrod, Politologe an University of Michigan, das erste. 15 Strategien, darunter ein Zufallsprogramm, nahmen Teil. Eine Strategie kann zum Beispiel lauten: Kooperiere immer. Oder: Kooperiere nie. Oder man gibt Quoten vor und setzt auf den Zufall. Oder man sagt: Kooperiere immer, bis du einmal betrogen wirst, danach nie wieder. Oder man sagt: Wenn der Gegenspieler bisher öfter kooperiert hat als nicht, dann koopiere ansonsten nicht. Und das wird dann bei jedem Spiel neu berechnet.
Die 15 Strategien des ersten Turniers bestanden aus 4 bis 77 Zeilen Basic-Code, jede Strategie trat gegen jede andere ungefähr 200 mal an, das ganze Turnier wurde fünfmal wiederholt. Gewonnen sollte die Strategie haben, die die meisten Punkte gemacht hatte.
Einzelheiten kann man bei Robert Axelrod, Die Evolution der Kooperation nachlesen. Das Original erschient 1984, meine deutsche Ausgabe ist von 1988, inzwischen gibt es sichere neuere Werke zum Thema. Der Großteil meiner Informationen in diesem Blogeintrag stammt aus dem Buch von Axelrod.

Die Gewinnerstrategie hieß jedenfalls tit for tat und stammte von Anatol Rapoport, Professor für Philosophie und Psychologie Uni Toronto. Generell stellte sich heraus, dass erfolgreiche Strategien diese zwei Eigenschaften aufwiesen:

* Anständigkeit (eher kooperieren) und
* Nachsichtigkeit (auch mal einee defection des anderen verzeihen.

3. Das zweite Turnier

Bald darauf gab es ein zweites Turnier. Diesmal mit 62 Teilnehmern, mit jeweils 4-152 Zeilen Programmcode. Die teilnehmenden Strategien hatten die Erkenntnisse des 1. Turniers umgesetzt. Es gab jetzt vor allem folgende Strategien:

* die einen achteten darauf, anständig und nachsichtig zu sein
* die anderen spezialisierten sich darauf, anständige und nachsichtige Strategien auszubeuten

Eigentlich naheliegend. Es gab unter beiden Richtungen erfolgreiche Teilnehmer. Wieder gewann tit for tat.

4. Die evolutionäre Variante

Die nächste Stufe war eine Art evolutionäres Turnier. Nach einigen Runden Jeder-gegen-jeden hatte jede Strategie Punkte gesammelt. Je mehr Punkte, desto mehr Exemplare dieser Strategie spielten in der Folgerunde mit. Wer zu wenig Punkte gemacht hatte, starb aus. Und so ging das einige Runden lang. Es stellte sich heraus:

a) Wie erfolgreich eine Stragie ist, hängt von der Umwelt ab. In einer Welt, die nur aus naiven Kooperieren besteht, kann eine fiese Strategie richtig gut absahnen. In einer Welt, die nur aus niemals kooperierenden Strategien besteht, kann eine gemäßigtere Strategie keine Punkte machen. Allerdings reicht schon ein kleiner Prozentsatz an Kooperierern, um diese Stragien stabil zu machen.

b) Die allzu blauäugigen und gutmütigen Strategien starben aus.

c) Danach starben auch die fiesen Strategien aus, weil ihnen die Opfer fehlten.

d) Am erfolgreichsten war wieder: Tit for tat.

5. Und danach?

Tatsächlich blieb tit for tat Jahr um Jahr der Sieger in diesen Turnieren. Erst vor einigen Jahren – ich will gerade nicht nachschlagen – tauchte eine Strategie auf, die noch erfolgreicher war. Eine raffinierte Strategie mit einem interessanten Twist, die allerdings auf tit for tat basierte.

Details dazu und zu tit for tat selber schreibe ich hier nicht. Es macht viel mehr Spaß, das alles selber herauszufinden. Ein guter Startpunkt sind die Links unten. Außerdem habe ich endlich einen guten Grund, lisaneun zu verlinken, die sich auch mit Spieltheorie beschäftigt, in einem Beitrag zum Gefangenendilemma und einem namens: Die Rache.


Im nächsten Kapitel: Das Braess-Paradoxon. Oder vielleicht auch nur Efronsche Würfel.

Nachtrag: Ausführliche Analysen zu Axelrods Turnieren hier.

Nachtrag: Äußerst schöne und erweiterte Gefangenendilemma-Visualisierung, im Browser spielbar (2017).

13 thoughts on “Das Gefangenendilemma

  1. Herr Rau Post author

    Kleines Beispiel für ein Gefangenendilemma: Den Schülern einer Klasse fällt die Prüfungsaufgabe vor dem Test in die Hände, so dass sich alle über die Fragen und Antworten informieren können. Allerdings: Wenn jetzt plötzlich jeder eine sehr gute Note kriegt, fällt der Betrug auf. Also sprechen sich die Schüler ab und machen aus, wer welche sehr gute bis befriedigende Note kriegt.

    In der Prüfung dann das Dilemma: Soll man sich an das Ausgemachte halten, oder soll man doch auf ein „sehr gut“ hin antworten? Wenn die anderen brav mitspielen (kooperieren), fällt es dem Lehrer ja nicht auf, wenn man sich nicht anden Plan hält (defektiert). Wenn alle kooperieren, gewinnt jeder Schüler eine einigermaßen ordentliche Note; wenn alle defektieren, fliegt alles auf. Im Idealfall kooperieren die anderen und man selber defektiert, wie beim Gefangenendilemma.

  2. Herr Rau Post author

    Toll, Frau Klugscheißer, vielen Dank. Ich wollte selber immer mal einen fertigen Kurs zum Thema schreiben, natürlich auf niedrigerem Niveau. Und zwar einen Kurs, den ich Schülern vorsetzen könnte – im Informatikunterricht hatte ich mal ein ähnliches, simpleres Projekt. Da ist diese Vorlesung (unter CC veröffentlicht) eine Fundgrube.

  3. Frau Klugscheisser

    Das erinnert mich an die sog. Dilemma-Methode nach Kohlberg – Spieltheorien, Fairness und Kooperation basieren schließlich auf der Entwicklung von moralischer Urteilsfähigkeit. Ich weiß nicht, in wie weit das sowieso schon im allgemeinen Lehrplan verwoben ist.
    Ich fand das hier ganz anschaulich, ebenso ein Beispiel aus Konstanz.

  4. Herr Rau Post author

    Dilemma-Methode: Das kannte ich noch nicht. Auch für diesen Hinweis vielen Dank, ich habe mir Zeit gelassen, die verlinkten Seiten gründlich zu lesen. Im Lehrplan steht das noch gar nicht, aber zur Methodik steht da ohnhehin nichts. Wenn man für die eine Methode gleich eine Ausbildung braucht… ist das einerseits vertrauenserweckend, gleichzeitig auch abschreckend. Falls Sie, Frau Klugscheisser, mal als Gast vorbeikommen und eine Probestunde halten wollen, sind Sie herzlich willkommen.

  5. Frau Klugscheisser

    Das Angebot ehrt mich, allerdings bin ich genauso viel/wenig ausgebildet wie sie. Ich bin nur im Zuge meines Studiums auf diese Dinge gestoßen und finde das alles recht interessant und ansprechend.

    Ein letzter Hinweis nun auf die Podcasts des Philosophischen Radios von WDR5.
    Es gibt da eine Folge (20) mit Susanne Boshammer über moralische Dilemmata, die ganz interessant ist. Nur wie man da aus dem freien Internet drankommt, weiß ich nicht so genau.

  6. Roger

    Jeweils zwei Schüler dealen miteinander. Die altersmässig jüngste Zweiergruppe fängt an. Zum dealen erhält jeder Schüler in der ersten Runde 3, in der zweiten Runde 10 Smarties. Das Spiel (abgewandeltes Gefangenendilemma) geht so: Beide Spieler sind durch eine Wand getrennt und sehen sich nicht (könnten theoretisch aber miteinander reden!). Der Lehrer ist die Bank mit unendlichem Smarties Vorrat. Jeder Schüler muss sich entscheiden, ob er dem Anderen einen Teil seiner eigenen Smarties schenkt. Wenn er das tut verdoppelt die Bank das Geschenk (= legt die gleiche Anzahl geschenkter Smarties zusätzlich drauf. Die Spieler entscheiden sich nun wieviele Smarties sie ihrem Mitspieler schenken wollen und legen das Geschenk für alle sichtbar vor sich hin. Dann wird die Wand gehoben und die Geschenke ausgetauscht. Dann gibt die Bank den jeweiligen Spielern den Bonus. Nachdem alle anwesenden Schüler gespielt haben gibt es eine Diskussion. Danach wird eine zweite Runde gespielt.

    Hab’s noch nicht ausprobiert. Könnte das funktionieren?

  7. Herr Rau Post author

    >Hab’s noch nicht ausprobiert. Könnte das funktionieren?

    Kommt sicher auf die Spielergruppe an, aber irgendwas kommt sicher heraus. In der Schule ist das ja auch gerne ein Metaspiel mit dem Lehrer dabei, für die, die das Spiel gleich durchschauen: Macht man das, was der Lehrer will, oder macht man das gerade nicht? Insofern würde ich gar nichts erwarten als Lehrer, sondern einfach mal schauen, was passiert.

  8. Herr Rau

    Blogger können sich jederzeit auf einen Kaffee und Austausch bei mir melden. (München.) Gab’s früher öfter, solche Besuche, ist bei mir etwas eingeschlafen. Schauen Sie einfach mal vorbei!

  9. Valle

    Herr Roger,

    Ihr Beispiel finde ich etwas erlahmend. Schließlich knüpft das nicht an ein Gefangendilemma. Beide Spieler werden alles verschenken, sodass sie immer das Doppelte herauskriegen. Interessant wäre es, wenn man durch das Nicht-Verschenken (beiderseits) sanktioniert wird. Beide SuS sollten für ihren Betrug mehr erhalten, durch Kooperation weniger….da lohnt sich bei mehreren Runden die Tit-for-tat Strategie.

  10. Roger

    Valle, ich nenne das Spiel inzwischen Ipd (Inverted prisonner dilemma). Interessant ist es genau in Bezug auf Kohlberg‘s Stufen der Moralentwicklung für Kinder zwischen 6 und 12 Jahren. Inzwischen habe ich es hunderte male gespielt – auch mit Erwachsenen – und obwohl das Spiel relativ einfach tönt, ist das Outcome sehr komplex. Und äusserst interessant. Ihr Vorschlag tönt für Erwachsene auf Anhieb logisch (ist es aber in der realen Welt nicht, nur in der abstrakten Theorie), führt aber bei Kindern dieses Alters zu gar keinem Spiel, denn alle werden nie nur ein Smarties setzen, denn durch das setzen von nur einem Smarties macht man sich ja erst bescheissbar. Aber eins kann man mit Sicherheit sagen: Sie haben Ipd weder ausprobiert noch irgendetwas verstanden.

    PS: Optimalerweise spielt man das Spiel mit 3 Smarties ca. drei oder vier Runden, danach Analyse (Fragen an die Schüler. Z.B.: «Wieso habt ihr nicht miteinander kommuniziert?», «Wer hat irgendetwas von ‹gegen den anderen gewinnen müssen› gesagt?», «Was passiert, wenn man den Gedanken ‹Die letzte Runde bescheisse ich› konsequent durch überlegt?», «Wieso ist ‹immer kooperieren › nicht immer eine gute Strategie? Und das Gegenteil auch nicht?»). Dann, wichtig: Partnerwechsel. Und dann noch einmal mit 3 Smarties dieselbe Anzahl Runden. Das widerholt man innerhalb eines oder zwei Jahre drei bis vier mal. Der Lerneffekt ist ausserordentlich. Man kann das Spiel als Leiter auf mehreren Ebenen analysieren: Spieltheorie, Moralentwicklung, Piaget‘s kognitive Entwicklung, Kommunikationstheorie, klassische Konditionierung, Schwarmintelligenz, SDi ist speziell interessant und einige Linien (Wilber et al) mehr…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.