Die Normalverteilung, Teil 1

Aus Gründen, die ich in einem folgenden Blogeintrag erklären werde, habe ich mich neulich etwas mit der Normalverteilung beschäftigt. Die wird gerne mal von Lehrern und Eltern im Mund geführt. Ich entschuldige mich gleich vorab bei allen Statistik-Erstsemestern, für die das hier alles olle Kamellen sind. Und sicher habe ich auch einige Fehler in meinen Überlegungen; man darf mich gerne darauf hinweisen.

Nehmen wir mal an, wir haben 300 Spieler. Jeder Spieler würfelt 10 mal mit einem Würfel und zählt zusammen, was herauskommt. Es wird wahrscheinlich kaum einen Spieler geben, bei dem das Minimum 10 herauskommt oder das Maximum 60, einige mehr mit 20 oder 50, und viele mit Werten zwischen 30 oder 40.
Die Chancen für 10 1er oder 10 6er beim Würfeln stehen nämlich jeweils bei (1/6)10 zu 1, das heißt etwa 1,6 mal bei zehn Millionen Spielern. Das wird bei 300 Spielern also nur äußerst selten vorkommen. Tatsächlich wird eine Verteilung der Ergebnisse bei 300 Spielern eher so aussehen:

Bei diesem Diagramm – unten wird es noch ein anderes geben – stehen auf der x-Achse die möglichen Ergebnisse von 10 bis 60 und auf der y-Achse die Häufigkeit, wie oft dieses Ergebnis bei einem Versuch mit 300 Spielern erreicht wurde. Selbst bei 3000 Spielern sieht die vorgestellte Kurve übrigens noch sehr krumm aus. Der Mittelwert (Durchschnitt) aller Ergebnisse liegt bei 300 oder 3000 Spielern ziemlich genau bei 35.
Die Ergebnisse bei diesem Spiel sind außerdem normalverteilt, da jedes Ergebnis die Summe verschiedener voneinander unabhängiger Einzelergebnisse ist (nämlich den einzelnen Würfen).

Für solcherart verteilte Ergebnisse gibt es eine Funktion, die Normalverteilungsfunktion. Da kommt dann eine Kurve heraus, die so aussieht, wie man sie sich vorstellt. Ein Beispiel:

Der Mittelwert für diese Kurve liegt bei 35, am häufigsten treten Zahlen etwa zwischen 30 und 40 auf, und Ergebnisse unter 20 oder über 50 gibt es fast keine. Die gestrichelten Linien bedeuten Folgendes: 68,3% aller Ergebnisse befinden sich in diesem Bereich, also gut zwei Drittel. Das gilt für alle Normalverteilungskurven.
Um diese Funktion zu berechnen und darzustellen, braucht man zwei Parameter: die Standardabweichung und (optional) den Mittelwert.

Die Standardabweichung gibt quasi an, wie sehr sich die Ergebnisse in der Mitte der Kurve ballen, oder wenn man so will, wie steil die Kurve ist. Hier sind zwei Normalverteilungen mit jeweils unterschiedlicher Standardabweichung:


In beiden Kurven beträgt der Mittelwert 3,5. Beide sind normalverteilt, trotzdem unterscheiden sie sich: In der ersten Kurve beträgt die Standardabweichung σ etwa 0,8, ist also relativ gering. Deswegen häufen sich in der Kurve die Ergebnisse mehr in der Mitte als in der zweiten Kurve: Dort ist die Standardabweichung mit σ=1,4 etwas größer ist. Die Werte weichen also etwas mehr von einem Standard ab, die Kurve ist flacher. In beiden Kurven sind wieder die gestrichelten Linien eingezeichnet, innerhalb derer sich jeweils gut zwei Drittel aller Ergebnisse befinden. (Die Linien ergeben sich jeweils aus dem Mittelwert +/- der Standardabweichung.)

Wir merken uns also erst einmal: es gibt nicht die Normalverteilung, sondern beliebig viele davon, die sich durch unterschiedliche Standardabweichungen unterscheiden. Die erste Kurve entspricht einer Schulaufgabe mit keinen 1er und 6ern, wenigen 2ern oder 5ern und vielen 3ern und 4ern. Die zweite Kurve entspricht einer Schulaufgabe mit wenigen 1er und 6ern, einigen 2ern und 5ern und mehr 3ern und 4ern. Beide Ergebnisse sind normalverteilt.

Wir merken uns außerdem: man muss die Kurven anders lesen als das erste Diagramm ganz oben. Die Höhe der Kurve sagt nichts über die absolute Anzahl der Teilnehmer mit den jeweiligen Ergebnissen aus. Selbst wenn ich die y-Achse mit Einheiten eingezeichnet hätte, könnte man das nicht. Kein Wunder: in die Kurve gehen als Information nur der Mittelwert und die Standardabweichung ein, nichts über die absolute Anzahl.

Wir merken uns drittens: der Mittelwert ist für die Kurve gar nicht so wichtig. Drei Schulaufgaben mit der Notenverteilung:

1 3x             1 -               1 -
2 12x            2 3x              2 -
3 12x            3 12x             3 3x
4 3x             4 12x             4 12x
5 -              5 3x              5 12x
6 -              6 -               6 3x

haben die gleiche Standardabweichung, die Kurve sieht gleich aus. Nur der Mittelwert ist anders, 2,50 im ersten, 3,50 im zweiten und 4,50 im zweiten Fall. Für die Grafik heißt das eigentlich nur, dass die Kurve etwas nach rechts oder links verschoben wird.

Ausprobieren und herumverschieben kann man das in folgendem kleinen Fenster. Aus technischen Gründen habe ich noch einen Faktor „Lupe“ ergänzt, der eigentlich überhaupt gar nichts bei der Normalverteilungsfunktion zu suchen hat. Aber damit kann man sozusagen den Maßstab der y-Achse sozusagen anpassen, damit man leichter etwas sieht.

Der Inhalt ist nicht verfügbar.
Bitte erlaube Cookies, indem du auf Übernehmen im Banner klickst.

Zoomen geht (browserabhängig) mit den Tasten +/-. Von den Icons im Menü oben braucht man das ganz linke zum Verändern der Werte und das ganz rechte zum Verschieben der Funktionskurve.

— Was heißt das alles für die Schule? Nehmen wir zum Beispiel mal eine Englischschulaufgabe, die ich vor ein paar Jahren geschrieben habe. Sie bestand aus acht Teilaufgaben, bei denen jeweils so etwa zwischen 6 und 10 Punkten erreicht werden konnten, so dass die maximal mögliche Punktzahl 60 betrug. 29 Schüler hatten mitgeschrieben. Das Ergebnis sah so aus:

Wenn man davon ausgeht, dass diese Ergebnisse normalverteilt sind – also vor allem, wenn die Ergebnisse der einzelnen Teilaufgaben unabhängig voneinander sind (was auch immer das in diesem Fall genau heißt) – und wenn man mal ignoriert, dass 29 Datensätze zu wenig sind, um viel Sinnvolles darüber sagen zu können, dann ergeben die Daten eine Standardabweichung σ von 6,59. Zusammen mit dem Mittelwert von 45,6 Punkten gäbe das folgende Normalverteilungsfunktion:

Laut Kurve haben 68,3% der Schüler zwischen 39 und 52 Punkte, nach den erreichten Punkten waren es 66%. Die Kurve beschreibt also tatsächlich halbwegs die Ergebnisse, sofern man das bei so geringen Datenmengen überhaupt sagen will.

Die Schüler kriegen aber keine Punkte auf ihre Schulaufgaben, sondern Noten. Dazu werden die erreichten Punkte reduziert auf sechs Notenstufen. Dabei gibt es natürlich einige Rundungsfehler. Bei der Schulaufgabe damals kam heraus:

1 3x
2 6x
3 10x
4 8x
5 2x
6 –

Mittelwert 3,03 und Standardabweichung 1,15. Als Kurve:

Na ja, passt so ungefähr. Viel mehr Übereinstimmung ist nicht zu erwarten, wenn man aus 29 Zahlen von 1-6 (die mit Rundungsfehler ermittelt wurden aus anderen Zahlen, die vielleicht normalverteilt sind) eine Standardabweichung ermitteln will. Es macht nicht viel Sinn, schätze ich, das hier überhaupt zu tun. Sobald die Noten nicht mehr so hübsch symmetrisch verteilt sind, liegt auch keine Normalverteilung mehr vor.

— Wozu das ganze überhaupt? Als Vorbereitung für den nächsten Eintrag. Und um ein Scherflein dazu beizutragen, die Welt daran zu erinnern, dass man „Standard“ mit „d“ hinten schreibt.

Neben der Standardabweichung gibt es auch noch die Mittelabweichung. Die sagt aus, um wieviel die Werte durchschnittlich vom Mittelwert abweichen. Bei der Standardabweichung werden Ausreißer mehr berücksichtigt, denn bei der Mittelabweichung kann der gleiche Wert herauskommen, wenn a) sich alle Ergebnisse um die Mitte scharen oder b) sich alle Ergebnisse auf die Extreme verteilen.

Die Wörter und die Dinge

Ich bin mit dem Deutsch-Leistungskurs an der Jahrhundertwende angelangt – Gegenströmungen zum Naturalismus, also Impressionismus und Symbolismus und fin de siècle und l’art pour l’art (statt: Kunst = Natur – X, wie wir im Deutschgeschäft sagen) und Stefan George und Rilke und Hofmannsthal. Eine Zeit, die ich mag.

Ein Thema der Zeit: Abkehr von der realistisch-naturalistischen Wirklichkeitswiedergabe durch die Kunst:

Die Kunst will jetzt aus dem Naturalismus fort und sucht Neues. Niemand weiß noch, was es werden möchte; der Drang ist ungestalt und wirr; er tastet ohne Rath nach vielen Dingen und findet sich nirgends. Nur fort, um je­den Preis fort aus der deutlichen Wirklichkeit, ins Dunkle, Fremde und Ver­steckte – das ist heute die eingestandene Losung für zahlreiche Künstler. (Hermann Bahr, „Symbolismus“)

Eine neue Methode der Wirklichkeitswiedergabe, die trotz nicht-realistischer Methode der Wirklichkeit doch wieder verblüffend nahe kommt, ist in der Malerei der Impressionismus. Gerade die Lichteffekte, das Flimmern von Laub an den Bäumen im Sonnenschein, sehen dann doch wieder aus „wie echt“. Auch hierzu Hermann Bahr:

Denken wir uns, Leonardo hätte zufällig die Technik des Impressionismus entdeckt. Er hat ja viel versucht und gern herumprobiert. Es wäre ihm also zugestoßen wahrzunehmen, dass die Farbe, in Flecken oder Punkten aufgetragen, eine Macht, eine Wahrheit erhält, die ihr sonst fehlt, und dadurch verführt, hätte er ein solches Bild gemalt, das, in der Nähe ein unerklärliches Gewimmel, auf einige Entfernung erst seine Form annimmt. Das hätte ihn gewiss gereizt. Schon weil es schwer ist. Auch weil es recht ein Vergnügen für seine mathematische Neigung gewesen wäre. [..] Und nun mögen wir uns ihn bei der Arbeit einmal von Messer Bandello besucht denken, der gern, wenn er Zeit hatte, zu ihm kam, auf einen kleinen Plausch und um ihm zuzusehen. Dem hätte er stolz seine Erfindung gezeigt und hätte ihm erklärt, wie es ihm durch sie möglich geworden, manche Erscheinungen, besonders gewisse Reflexe des Lichtes, einzufangen, die so flüchtig sind, dass die meisten Menschen sie gar nicht gewahren, sondern erst jetzt, da er sie gemalt, allmählich auf sie achten würden. Und wir meinen den klugen Bandello fast zu sehen, wie er neugierig zuhört, die Worte des Meisters an seinem Bilde prüft, ein paarmal nickt, aber dann doch, als jener verstummt, leise und fast ein wenig spöttisch lächeln muß, indem er sagt: „Wohl erinnere ich mich, Messer Leonardo, solche Erscheinungen, wie Ihr sie nennt, und besonders der ganz eigenen Reflexe, die sich manchmal auf die Körper legen, wie Wolken über den Himmel ziehen; und es ist mir oft ein Spaß gewesen, das zierliche weiße Näschen einer hochgeborenen und wohlgestalten Dame, wenn wir durch den Garten in der Sonne gingen, plötzlich an der Spitze grasgrün gefleckt zu sehen, ganz wie Ihr es hier auf Eurem komischen Bilde gemalt habt. Aber Ihr wisst so gut wie ich, mein werter Freund, dass das Näschen deswegen doch nicht grün ist, sondern weiß bleibt und es nur unsere Sinne sind, die uns täuschen. […] Ferner erlaubt mir, Euch zu sagen, dass ich hier, dicht an das Bild herantretend, mich gar nicht auskennen kann und keineswegs weiß, was es denn eigentlich sein soll. Nun habt Ihr freilich von mir verlangt, mich fünf Schritte weit aufzustellen; dies sei die Bedingung. Aber erlaubt mir, zu bemerken, Messer Leonardo, daß das nicht die Bedingung der Natur ist. Die Natur entsteht nicht erst, wie Euer Bild, wenn ich mich in ein bestimmtes Verhältnis zu ihr gebe. Sie vergeht nicht, wenn ich es verlasse, die Natur ist immer da, ob ich bin oder nicht. Euer Bild wird erst, wenn ich es ansehe.

Man entdeckte: Das mit der einfachen Wiedergabe der Natur ist gar nicht so einfach. Der Mensch kann nicht anders, als sich in ein Verhältnis zu ihr begeben, und er kann nicht anders, als sie nur mittelbar wahrnehmen. Das gilt nicht nur für die Wahrnehmung, sondern ebenso dafür, wenn man versucht, der Natur mit Worten Herr zu werden. Das Verhältnis zwischen Wörtern und Dingen ist komplizierter, als man lange angenommen hatte.

(Und hier fehlt eine Überleitung, von der ich nicht weiß, wie legitim sie wäre, da ich zu wenig über George und Hofmannsthal weiß.)

Dazu gehört auch der berühmte Chandos-Brief, in dem Hugo von Hofmannsthal seine Kritik an der Sprache als Ausdrucksmöglichkeit in ausdrucksvolle Worte fasst. Die Worte „zerfielen mir im Munde wie modrige Pilze“, schreibt er. Zuerst die abstrakten, aber dann hat er auch mit den konkreten Dingen Schwierigkeiten: „Eine Gießkanne, eine auf dem Feld verlassene Egge, ein Hund in der Sonne, ein ärmlicher Kirchhof, […] und die tausend anderen ähnlichen [Gegenstände], über die sonst ein Auge mit selbstverständlicher Gleichgültigkeit hinweggleitet, kann für mich plötzlich in irgendeinem Moment, den herbeizuführen auf keine Weise in meiner Gewalt steht, ein erhabenes und rührendes Gepräge annehmen, das auszudrücken mir alle Worte zu arm scheinen.“

Sprachkrise eben. Diese führt dann einige Zeit später auch dazu, dass sich die Expressionisten eine eigene Sprache geben, und die Dadaisten sowieso. Um das Problem mit den Wörtern und den Dingen meinen Schülern ein bisschen begreifbarer zu machen, fange ich meist mit einem Gedicht von Michael Ende an, „Der wirkliche Apfel“, das so beginnt:

Ein Mann der Feder, berühmt und bekannt
als strenger Realist,
beschloß, einen einfachen Gegenstand
zu beschreiben, so wie er ist:
Einen Apfel zum Beispiel, zwei Groschen wert,
mit allem, was dazugehört.

Dieser Mann der Feder scheitert an seinem Projekt, er stellt fest, dass er zur treffenden Beschreibung des Apfels ja auch erklären muss, wo er herkommt und wie er schmeckt, die Jahreszeiten, den Baum, den Markt, und nach tausenden von Seiten immer noch nicht fertig ist. Mit der Sprache lässt sich der Apfel nicht vollständig erfassen. Der fiktive Mann der Feder zieht allerdings einer andere Konsequenz als der fiktive Lord Chandos aus diesem Ungenügen der Sprache:

Von da an ließ er es bleiben,
die Wirklichkeit zu beschreiben.
Er begnügte sich indessen
damit, den Apfel zu essen.

Ein schöner Paralleltext dazu ist der hier von Richard P. Feynman, Physiker und Autor verschiedener vergnüglicher naturwissenschaftlicher Bücher:

Ein Poet sagte einst „Das gesamte Universum liegt in einem Glas Wein“. Wir werden wahrscheinlich nie wissen, in welchem Sinn er das meinte, denn Poeten schreiben nicht, um verstanden zu werden. Aber es ist wahr, daß wir bei näherer Betrachtung eines Glases Wein das gesamte Universum sehen. Da sind die Dinge der Physik: die sich drehende Flüssigkeit, welche in Abhängigkeit von Wind und Wetter verdampft: die Reflexionen im Glas, und unsere Phantasie fügt die Atome hinzu. Das Glas ist ein Destillat der Erdgesteine, und in seiner Zusammensetzung sehen wir die Geheimnisse des Alters des Weltalls und die Evolution von Sternen. Welch seltsame Anordnung von Chemikalien befindet sich im Wein? Wie sind sie entstanden? Da gibt es die Fermente, die Enzyme, die Substrate und die Produkte. Dort im Wein ist die große Verallgemeinerung zu finden: Alles Leben ist Fermentation. Niemand kann die Chemie des Weines entdecken, ohne, wie Louis Pasteur, die Ursachen vieler Krankheiten zu entdecken. Wie lebendig ist der Rotwein, der seine Existenz dem Bewußtsein aufprägt, welches ihn beobachtet! Wenn unser kleiner Verstand aus irgendeiner Bequemlichkeit dieses Glas Wein, dieses Universum, unterteilt in Physik, Biologie, Geologie, Astronomie, Psychologie usw., dann erinnern wir uns daran, daß die Natur dies nicht kennt! Also wollen wir wieder alles zusammenfügen und endlich nicht vergessen, wozu es da ist. Lassen wir es uns noch ein letztes Vergnügen bereiten: Trinken wir es und vergessen alles!“

Zitiert nach: Gero von Randow (Hg.), Mein paranormales Fahrrad und andere Anlässe zur Skepsis, entdeckt im Skeptical Inquirer. Reinbek bei Hamburg: Rowohlt 1993 (rororo science), S. 213. Von Feynman auch lesen: „Sie belieben wohl zu scherzen, Mr. Feynman“.

Die Parallelen finde ich interessant.

Aber so entspannt wie Ende und Feynman sieht der deutsche Dichter die Sprachkrise selten. Klaus Modick parodiert die „Sprachnot“ dieser Spezies in seinem Roman Ins Blaue. Kurt trifft seinen Freund Feuerstein in der Stammkneipe, und der flirtet gerade mit einer, wie sich herausstellt, Lyrikerin. „Geht alles nur um ein Thema. Um das Thema gewissermassen. Es geht bei allen Künstlern immer wieder nur um dies eine Thema“, sagt Feuerstein. Nein, nicht der Geschlechtsverkehr, wie Kurt meint, sondern: „‚Sprachnot‘, hauchte Petra.“ Sie schreibe davon, „warum sie, warum man eigentlich gar nicht schreiben kann. Über die Qual des Schreibens sozusagen. Über die Unmöglichkeit, auch nur das kleinste, das einfachste Ding durch Sprache zu benennen.“ Aber sie lässt sich leicht dazu überreden, aus ihrem Werk zu rezitieren.

(Klaus Modick: Vor zwanzig Jahren, vier, fünf Bücher gelesen, die mir sehr gut gefallen haben. Vor ein paar Monaten ein neues gelesen, das ich sehr mäßig fand. Bin ich älter geworden oder er? Oder er nicht?)

— An dieser Stelle leite ich dann über zur Sapir-Whorf-Hypothese und der Frage, wie sehr die Sprache das Denken determiniert oder wenigstens beeinflusst. Halbwegs aktueller Text dazu: „Eins, zwei, viele“ aus der SZ. Darin geht es um die etwa 200 Sprecher einer Sprache im Amazonas, Pirahã. In dieser Sprache gibt es keine Wörter für Zahlen größer als zwei, und selbst die Bedeutung der Wörter „eins“ und „zwei“ ist nicht ganz exakt. Das führt dazu, das die Sprecher dieser Sprache auch keine Vorstellung von Zahlen haben. (Siehe Beschreibung der Experimente im Text. Ist leider nur sehr oberflächlich und keineswegs eindeutig, aber zur Problematisierung reicht es. Wer weiter machen möchte: Pirahã bei Wikipedia. Keine Rekursion, keine Farbadjektive. Exkurs zu Farbadjektiven in verschiedenen Sprachen möglich.)

Dazu Bilder von Monet und Renoir, ein Pointillist oder zwei, und die bekannte Ceci n’est pas une pipe-Serie von Magritte, außerdem „Le bons sens“ und „Les deux mystères“. Vielleicht sollte ich das alles auch mal in einen Moodlekurs packen.

Schule 1.0 – Das Herbarium

Habe ich schnell beim Kollegen stibitzt: 6. Klasse Biologie, auch bekannt als Naturundtechnik. Die Schüler erhielten einen Auftrag, eine Anleitung und reichlich Zeit dazu, ein Herbarium anzulegen – eine Sammlung von Wiesenblumen mit deren Bestimmung.

Eine Schülerin hat ihres letzte Woche schon vor dem Termin abgegeben, und da habe ich es mir ausgeliehen und darin geblättert. Ein dicker Hefter DIN A 4 mit Folien drin:

herbarium1_hahnenfuss

herbarium2_stiefmuetterchen

herbarium3_schafgarbe

Frau Rau zeigt mir ja tatsächlich ein- oder zweimal im Jahr eine Blumenwiese, und viele gelb blühenden Pflanzen kann ich auch bestimmen. Na ja, manche. Es interessiert mich jedenfalls. Wir haben beide im Buch geblättert und daraus gelernt.

Mir gefällt vor allem die Schafgarbe, die ich vom I Ging her kenne, auch wenn heute statt der Pflanzenstengel wohl meist Münzen verwendet werden. (Von den Schildkrötenpanzern ist man ganz abgekommen.)

Ich weiß nicht, ob es Noten auf diese Bestimmungsbücher gibt. Hausaufgaben dürfen in Bayern am Gymnasium zwar nicht benotet werden, solche Projekte und praktische Arbeiten schon – auch wenn da genauso die Eltern helfen können. Und ich habe auch nichts dagegen, dass die Eltern dabei helfen. Helfen, nicht selbermachen, aber das sieht man als Lehrer ja. In einer Ganztagsschule würde man mehrere Nachmittage auf der Wiese verbringen, aber wir haben keine Ganztagsschule (und ob die kommenden Lehrpläne Zeit für solche Bestimmungsbücher lassen, bezweifle ich). Soll man deshalb darauf verzichten, Schülern solche Aufgaben zu stellen?

Aberglaube

Der Lehrerfreund bringt eine kurze Nachricht, dass die Skeptikervereinigung GWUP herausgefunden hat, dass auffällig viele Lehrer und Erzieher zu den Anhängern obskurer Theorien gehöen.

Hat mich nicht überrascht.

(Offenlegung: Ich kannte die GWUP schon und habe auch schon eines ihrer Bücher mit Genuss und Belehrung gelesen.)

Siehe dazu auch bei den Science Blogs: Esoterik im Biomarkt. Der Autor stellt dort nur fest, dass es so ist und bringt viele Beispiele. Warum das so ist, wird in den Kommentaren diskutiert.

Charles Darwin zum Geburtstag

Charles Darwin wird heute 200 Jahre alt. Vor ein paar Jahren habe ich sein The Origin of Species gelesen. Es hat mich überrascht, wie spannend, leicht nachzuvollziehen und wunderbar logisch und konsequent es aufgebaut war. Besonders spannend war es, Wissenschaft beim Entstehen zuzuschauen: Darwin gesteht freimütig ein, wenn er einen Zusammenhang noch nicht erklären kann, wenn es Lücken in seiner Argumentation gibt. Mit dem heutigen Wissen (etwa um Gene und Vererbung) ist es leicht, manche dieser Lücken zu schließen, und eben das lässt den Respekt vor Darwins Leistung wachsen. (Ähnlich ging es mir mit Leonard Eulers „Briefen an ein eine deutsche Prinzessin“, in der er ihr die Welt der Physik erklärt.)

Hier eine ganz kurze Zusammenfassung der Kapitel von The Origin of Species.

Kapitel 1: Variation durch menschliche Züchtung. Am Beispiel der Taubenzüchtung zeigt Darwin, wie in relativ kurzer Zeit verschiedene Rassen durch die Auswahl des Menschen entstehen können.

Kapitel 2: Auch in der Natur gibt es Variationen. Am meisten bei weit verbreiteten Arten.

Kapitel 3 und 4: Auswahl durch die Natur (statt durch den Menschen). Wettbewerb sorgt dafür, dass manche Varianten sich mehr vermehren als andere.
Das ist die große Leistung Darwins (und unabhängig dazu von Alfred Russel Wallace). Den Gedanken der Vererbung gab es auch bei Lamarck: Die Giraffe streckt ihren Hals, um ans Futter zu gekommen, und vererbt diesen langen Hals an die nächte Generation weiter. So nicht, sagt Darwin: Nachkommen unterscheiden sich irgendwie von den Eltern, aber schon von Geburt an, und durch natürliche Auswahl entstehen dann zuerst verschiedene Rassen, und nach vielen weiteren Generationen dann aus diesen verschiedene Arten.

Kapitel 5: Regeln der Variationen. Etwa: Körperteile, die nicht mehr gebraucht werden, werden durch die natürliche Auswahl nicht bevorzugt, im Gegenteil, sie verkümmern. Beispiel: Verlust der Flugfähigkeit, wenn sie evolutionär keinen Vorteil mehr bringt.

Kapitel 6: Probleme mit dieser Theorie. Warum es keine Zwischen- oder Übergangsarten gibt. Wie so etwas Kompliziertes wie das Auge entstehen kann. Und vieles andere, was mir auf Kreationistenseiten immer noch und immer wieder als Gegenargumente begegnen, widerlegt schon vor 150 Jahren.

Kapitel 7: Instinkt. Wie sich so etwas entwickeln kann. Aber vor allem: Wie sich zum Beispiel bei Bienen Drohnen oder andere sterile Formen herausbilden können – wie bitte sollen die denn ihre Gene weitergeben? Klug, sehr klug.

Kapitel 8: Fortpflanzung unter sehr nah verwandten Arten und unter den so entstandenen Hybriden. Also: Pferd und Esel sind begrenzt fortpflanzungsfähig, das entstandene Maultier ist das noch sehr viel begrenzter, in der Regel gar nicht. Gründe dafür.

Kapitel 9: Warum es nicht für alle Zwischenstufen fossile Funde gibt. Auch immer wieder als Argument gegen die Evolution vorgebracht. Kinder, das steht alles schon bei Darwin.

Die nächsten Kapitel: Untersuchung der geografischen Verwandschaft verschiedener Arten, organische Verwandschaft, Entwicklung des Embryos, ähnliche technische Fragen.

Zum Schluss: Eine Zusammenfassung, beginnend mit den offenen Fragen und Problemen seiner Theorie. (Wie viel hätte er erklären können, wenn er schon von Genen und DNA gehört hätte. Aber von Mendel wusste er noch nichts.) Warum die Leute Schwierigkeiten haben, zu akzeptieren, dass sich Tierarten ändern können. Anwendbarkeit auf den Menschen.

Insgesamt: Wirklich sehr gut lesbar.

Life (der Zellautomat)

Es gibt eine Art Computerspiel namens Life, nach dem Erfinder auch Conway’s Game of Life genannt. Man spielt nicht selber mit, sondern man setzt ein paar Zellen in eine leere Welt und schaut zu, wie sie sich vermehren oder sterben. Das sieht zum Beispiel so aus:

Die Regeln für das Überleben, Fortpflanzen und Sterben lauten so:

  • Fortplanzung: Hat eine unbesetzte Zelle genau drei lebende Nachbarn (in den acht umgebenden Feldern), dann entsteht in der nächsten Generation dort eine neue lebende Zelle.
  • Leben oder Tod: Eine lebende Zelle mit genau 2 oder 3 Nachbarn überlebt in die nächste Generation. Bei mehr oder weniger Nachbarn stirbt sie.

Wenn man das ein paar Mal mit verschiedenen Ausgangskonstellationen spielt, stellt man einige Sachen fest. Es gibt zum Beispiel manche Kombinationen aus Zellen, die stabil sind: der Brotkorb oder die Bienenwabe etwa. Wenn die nicht gestört werden, dann stirbt keine Zelle und keine neue entsteht.


(Arbol1, CC-BY-SA, Quelle)

Dann gibt es noch Kombinationen, die oszillierend stabil sind. Am einfachsten ist der Blinker, der periodisch zwischen zwei verschiedenen Formen wechselt.


(Arbol1, CC-BY-SA, Quelle)

Und dann gibt es noch die Gleiter. Die sehen so aus, als bewegen sie sich fort, und zwar diagonal. Immer nach vier Takten haben sie sich horizontal und vertikal eine Zelle weiterbewegt.


(Quelle)

Insgesamt stellt man bei den ersten Versuchen fest, dass früher oder später die Welt zur Ruhe kommt und nur noch aus stabilen Figuren besteht und vielleicht einigen Gleitern dazu, die immer weiter in die Unendlichkeit hinausfliegen: Die Gesamtpopulation wächst nicht mehr.

Bald nachdem Conway das kleine Spielchen erfand, stellte er eine Herausforderung: Kann es eine Startpopulation von Zellen geben, die immer größer wird? Fünzig Dollar schrieb er aus und rechnete laut Wikipedia nicht damit, sie zahlen zu müssen.

Bis dieses Ding erfunden würde: eine Gleiterkanone.


(Quelle)

So sieht sie in Betrieb aus:


(Kieff, CC-BY-SA, Quelle)

Periodisch entsteht ein neuer Gleiter, und damit war gezeigt, dass die Gesamtpopulation bei Life immer weiter ansteigen kann.

Das war aber nur der Anfang. Weitere Gleiterkanonen wurden entdeckt. Bald kamen die Raumschiffe dazu: LWSS, MWSS, HWSS (lightweight/middleweight/heavyweight spaceship) und kompliziertere Varianten.
Nach und nach entstanden immer umfangreichere Populationen. Es gibt „Puffer“, das sind Konvois von Zellen, die sich zum Beispiel nach rechts bewegen und dabei einen Strom von Müll hinterlassen – Müll, der sich nach kurzer Zeit zu Gleiterkanonen entwickeln kann, die dann das tun, was sie am besten können – Gleiter produzieren. Es gibt „Filler“, die versuchen, die Welt mit so vielen Zellen und so rasch wie möglich zu füllen. Man geht davon aus, dass die maximale Zellendichte 50% beträgt.

Und dann wurde es noch komplizierter. Primzahlberechnung: Eine Population, die einen Strom von Gleitern erzeugt, und nur jeden x-ten Gleiter durch ein Tor passieren lässt – und zwar dann, wenn x eine Primzahl ist. Nachbildungen verschiedener elektrischer Schaltkreise, mit einem kontinuierlichen Strahl von Gleitern als informationstragendem Stromfluss. Und wenn man Schaltkreise hat, dann kann man auch einen Computer nachbauen, wenn man denn wollte. Ja, mit Life kann man alles berechnen, was man berechnen kann. Die folgende Population berechnet Fermat-Primzahlen:

life_fermat_prim

Eine Fermat-Zahl hat die Form Fn = 2(2n) + 1, wobei n eine natürliche Zahl ist. Für n = 1 bis 5 sind die entstandenen Zahlen Primzahlen, vermutlich gibt es keine weitere Fermat-Zahl, die prim ist. Die Life-Konfiguration oben wird rechnen und rechnen, und wenn noch eine Fermat-Zahl herauskommt, wird sie sich auflösen.

Vom Berechnen:

Stellen wir uns diese zugegebenermaßen arg unwahrscheinliche Situation vor: Ein Lehrer gibt seinen Schülern den Auftrag, jeweils ein eigenes Life-Muster zu erzeugen, für ein Poster vielleicht. Er möchte, dass jeder ein eigenes entwirft, und nicht einfach das von einem Mitschüler nimmt und lediglich ein paar Generationen weiterlaufen lässt. Weil der Lehrer viele Schüler hat, hätte er gerne ein Computerprogramm, in das man zwei beliebige verschiedene Momentaufnahmen einer Life-Welt eingibt, und das Programm rechnet aus, ob es möglich ist, dass sich die eine Situation aus der anderen entwickeln kann oder nicht. Wenn das Programm ausspuckt: Jawoll, dieser eine Zustand kann sich nicht aus dem anderen entwickeln, die sind grundverschieden, dann weiß der Lehrer, dass hier zumindest kein einfaches Abschreiben stattgefunden hat.

Nur ist es leider unmöglich, so ein Programm zu schreiben. Braucht man gar nicht erst versuchen. Wird nicht gehen. Nie nicht. Das ist so quasi das Perpetuum Mobile der Informatik: Kann nicht sein.

Denn das Problem ist unentscheidbar. Das ist ein Fachbegriff aus der theoretischen Informatik, den ich bei den formalen Sprachen immer mal wieder erwähnt habe. Die genaue Erklärung muss warten, bis ich meinen Eintrag zu Chomsky 0 schreibe, der Menge der Sprachen, die immerhin semi-entscheidbar sind. Grundsätzlich kann man kein Programm schreiben, das überprüft, ob zwei andere Programme sich unter allen Umständen und für alle Eingabewerte immer gleich verhalten werden. Ein „Programm“ ist dabei alles, was so viel berechnen kann wie eine Turingmaschine, oder eine simple Programmiersprache, die einigen wenigen Kriterien genügt. (Oder was man mit dem Lambda-Kalkül beschreiben kann. Aber da begebe ich mich endgültig auf halbverstandenes Terrain.)

Und ja, jemand hat auch eine Turing-Maschine mit Life produziert:

life_tm

Fußnote: Genau genommen ist Life ein Beispiel für einen Zellautomaten. Die bestehen aus vielen benachbarten Zellen (im diesem Fall in einer Schachbrettwelt, es könnte aber auch eine Welt aus Sechseckfeldern oder eine dreidimensionale sein), die bestimmte Zustände annehmen können (in diesem Fall nur zwei, lebendig oder unbelebt, es könnten aber auch mehr sein) und die nach bestimmten Regeln ihre Zustände ändern.

Links:

Das Braess-Paradoxon

(Aus der Reihe: Alles muss raus. Angefangene Blogbeiträge des Jahrs 2008 aufräumen. Diesmal wohl nur für Mathematikfreunde.)

Vieles zum Braess-Paradoxon steht in Wikipedia. Auch die Illustrationen in diesem Blogbeitrag habe ich daraus genommen (Autor AlterVista, CC-BY 3.0, Details hitner demLink). Eigentlich wollte ich das selber und anders zeichnen, aber ich komme wohl doch nicht dazu.

Der Kern des scheinbaren Paradoxons ist der, dass eine Situation verschlechtert werden kann, wenn man eine weitere, optionale Alternative anbietet. Man baut zum Beispiel eine neue, zusätzliche Straße, und es gibt mehr Staus. Oder auch umgekehrt: man sperrt eine vorhandene Straße, und plötzlich kommen alle schneller voran.

Man stelle sich wie in dieser Zeichnung die vier Orte A, B, C und D vor. Verbunden sind sie auf folgende Weise durch Autobahnen (blau) beziehungsweise Landstraßen (gelb):

braess1

Die Landstraßen sind relativ kurz, verstopfen aber auch schneller bei viel Verkehr. Man braucht für die gelben Strecken also 10 mal x Minuten, wobei x die Anzahl der Autos auf der Strecke ist (in Tausendern, der Einfachkeit halber). Sind 2000 Autos unterwegs, braucht man 10 mal 2 Minuten, bei 4000 Autos sind es schon 40 Minuten.
Die blauen Strecken sind länger, aber besser ausgebaut und verstopfen nicht so schnell Man braucht für sie 50 plus x Minuten, wobei x wieder die Zahl der Autos auf der Strecke ist (in Tausendern). Bei 2000 Autos braucht man 52 Minuten, bei 4000 auch nur 54 Minuten.

Wenn Autofahrer von A nach D wollen, dann können sie die Route ACD nehmen oder ABD. Nehmen wir an, in einer Stunde wollen 6000 Autos von A nach D. Die Hälfte wird die eine Strecke nehmen, die andere Hälfte die andere. Der Wert von x ist also jeweils 3 (für 3000 Autos):

braess2

Fahrzeit für jedes Auto: (10 mal 3) + (50 plus 3), also 83 Minuten.

Jetzt wird eine zusätzliche Straße gebaut, ein Tunnel. Fahrzeit: 10 plus x Minuten. Man braucht nicht viel Zeit dafür, auch bei großer Verkehrsdichte.

braess3

Auch hier wird sich bald ein Gleichgewicht einpendeln. Unsere 6000 Fahrer von vorhin werden sich wieder so auf die Strecken verteilen, dass jeder gleich viel Zeit benötigt. Dabei werden jeweils 2000 Fahrer die Strecke ABD fahren, 2000 die Strecke ACD und die letzte 2000 Fahrer ABCD. Pro Stunde fahren 4000 Autos auf den Landstraßen und 2000 Fahrzeugen pro Stunde auf den Autobahnen und im neuen Tunnel:

braess4

Die Fahrdauer ist jetzt für alle 92 Minuten – neun Minuten länger als ohne die zusätzliche Strecke. Und wenn ein einzelner denkt, er fährt dann halt doch eine der anderen Strecken, dann wird er dort etwas länger brauchen als 92 Minuten (und die Fahrer auf seiner alten Strecke etwas weniger). Wenn alle Fahrer darauf verzichten würden, die neue Strecke zu benutzen, dann wären wieder alle bei 83 Minuten. Aber einer käme vielleicht doch in Versuchung, den Tunnel zu benutzen, und bräuchte nur 70 Minuten. Aber die anderen würden es ihm, so ist der Mensch, gleichtun, und wieder würde sich das Gleichgewicht bei 92 Minuten einpendeln.

(Parallelen zum Gefangenendilemma sind erkennbar.)

Für die Anwendbarkeit im echten Leben siehe Wikipedia. Interessant ist auch der Link dort zum Eisverkäufer-am-Strand-Problem.

Efronsche Würfel

(Auch wenn Wikipedia und weitere Fundstellen „Efrons Würfel“ dazu sagen: Zumindest in der Überschrift bleibe ich bei der Version, an die ich mich gewöhnt habe.)

Ein bisschen Mathematik:

Wenn Groucho älter ist als Chico, und Chico älter als Harpo, dann ist Groucho auch älter Harpo. So ist es in der wirklichen Welt, und in der Mathematik heißt das, dass „älter sein“ eine transitive Beziehung ist. Dass „älter sein“ transitiv ist, ist einleuchtend. Aber nicht alle Beziehungen sind transitiv, und das widerspricht manchmal der Intuition.

So zum Beispiel „besser sein“, im Sinne von Fußballmannschaften oder Schülern. Wenn A eine bessere Mannschaft ist als B, und B eine bessere Mannschaft als C, ist A dann automatisch eine bessere Mannschaft als C?

Efronsche Würfel sind ein Sonderfall von nicht-transitiven Würfeln. Es gibt beliebig viele Varianten davon; es können zum Beispiel vier normale sechsseitige Würfel mit folgender Beschriftung sein:

Würfel A: 4, 4, 4, 4, 0, 0
Würfel B: 3, 3, 3, 3, 3, 3
Würfel C: 6, 6, 2, 2, 2, 2
Würfel D: 5, 5, 5, 1, 1, 1

Diese vier Würfel haben folgende Eigenschaft: Keiner von ihnen ist der beste. (Besser heißt hier, dass man mit einem Würfel eine größere Chance hat, eine höhere Zahl zu würfeln, als mit einem anderem.)

Würfel A gewinnt gegen Würfel B mit einer Wahrscheinlichkeit von 2/3.
Würfel B gewinnt gegen Würfel C mit einer Wahrscheinlichkeit von 2/3.
Würfel C gewinnt gegen Würfel D mit einer Wahrscheinlichkeit von 2/3.
Würfel D gewinnt gegen Würfel A mit einer Wahrscheinlichkeit von 2/3.

„Besser sein“ ist in diesem Fall eben nicht transitiv. Insofern ist „kann besser Englisch“ wohl auch nicht transitiv, denke ich – anders als Schulnoten das suggerieren.

Weitere intransitive Würfel und eine ausführlichere Erklärung bei Wikipedia. Das wollte ich nur mal loswerden.

Kognitive Dissonanz

Ich lese gerade Mistakes were made (but not by me) von Carol Tavris und Elliot Aronson. Untertitel: „Why we justify foolish beliefs, bad decisions, and hurtful acts“. Ich bin erst am Anfang, will aber trotzdem jetzt schon ein paar Gedanken dazu loswerden.

Kognitive Dissonanz„, so Wikipedia, ist „eine Theorie, die erklärt, wie durch miteinander unvereinbare Kognitionen – Wahrnehmungen, Gedanken, Meinungen, Einstellungen, Wünsche oder Absichten – innere Konflikte entstehen, die Vermeidungsreaktionen oder andere zur Verminderung dieser Konflikte geeignete Handlungen hervorrufen.“

Solche unvereinbaren Beobachtungen sind zum Beispiel: a) ich bin ein ehrlicher Mensch und b) ich betrüge bei meiner Steuererklärung. Oder der historische Fall, der als Auslöser für die Enstehung der Theorie genannt wird: a) ich habe all mein Hab und Gut aufgegeben, weil meine Kult-Chefin von Außerirdischen vom Planeten Clarion erfahren hat, dass am 21. Dezember die Welt in einer riesigen Flutkatastrophe untergehen wird und nur die Gläubigen von fliegenden Untertassen gerettet werden und b) es ist der 22. Dezember und trocken.

Diese unvereinbaren Tatsachen führen zu einer „kognitiven Dissonanz“, die der Mensch abzubauen bestrebt ist. Man „betrügt“ eben nicht bei der Steuer, sondern holt sich nur das, was einem zusteht. Und die Angehörigen des Kultes haben sich tatsächlich nicht von ihrer Anführerin abgewandt, sondern im Gegenteil: Je mehr Energie – Zeit, Geld – sie in ihren Glauben investiert hatten, desto eher blieben sie dabei. Nur wegen der Gläubigen nämlich, so erklärten sie es sich, wurde die Menschheit für diesmal verschont und bekam etwas Aufschub. Jaja. Je mehr man sich blöd benommen hat, desto größer ist das Bedürfnis, sich eben nicht blöd benommen zu haben. Und je blöder die Aufnahmezeremonie in eine Studentenverbindung, desto größer die Dissonanz zum Selbstbild („Ich bin doch nicht blöd.“) – die man zum Beispiel dadurch auflösen kann, dass man die Verbindung für ganz, ganz toll hält.

Kann alles stimmen, kann auch nicht. Wissenschaftlich ist es, Theorien im Experiment zu überprüfen. Das ist zum Beispiel so geschehen (und von anderen Wissenschaftlern mehrfach wiederholt worden): An der Universität von Stanford wurde – vorgeblich – eine studentische Gruppe gegründet, die sich mit der Psychologie des Sex beschäftigte.
Die Hälfte der Interessierten bekam eine einfachen Aufnahmezeremonie, die andere eine hochnotpeinliche. Danach bekamen die neuen Mitglieder eine inszenierte (auf Tonband aufgenommene) Diskussion zu hören, die ziemlich uninteressant und schlecht durchgeführt war. Diese Diskussion sollten sie dann in Fragebogen bewerten. Diejenigen mit der einfachen Aufnahmezeremonie bewerteten sie deutlich schlechter als diejenigen mit der peinlichen. — Elliot Aronson and Judson Mills (1959), „The Effect of Severity of Initation on Liking for a Group,“ Journal of Abnormal and Social Psychology, 59, pp 177-181.

Die Theorie der kognitiven Dissonanz erklärt das so: Es gibt einen Widerspruch zwischen dem Aufwand für die Aufnahme in die Gruppe und ihrem tatsächlichen Wert. Diesen Widerspruch ist um so größer, je größer ebendieser Aufwand war (und je kleiner der Wert dafür). Man kann den Widerspruch verringern, indem man den Wert der Gruppe höher ansiedelt – sie sich schönredet. Je größer der Widerspruch bei den Versuchpersonen war, desto mehr geschah das.

Ein weiteres Beispiel: Wenn ein Mensch böse zu einem anderen ist, dann kann das zu einer Dissonanz führen: a) ich bin ein guter Mensch und b) ich tue dem anderen Leid an. Auflösen kann man den Widerspruch prima durch ein „Also wird er es wohl verdient haben.“

Sehr schön an dem Buch sind die ausführlichen Fußnoten mit Quellenangaben. Darin bin ich auf den Aufsatz mit diesem wunderschönen Titel gestoßen: Why people fail to recognize their own incompetence (pdf) von David Dunning, Kerri Johnson, Joyce Ehrlinger und Justin Kruger. (Current Directions in Psychologial Science 12, 2003, pp. 83-87.) Allein wegen dieses Titels sollte man viele Kopien davon dezent im Lehrerzimmer ausliegen lassen und ihn vielleicht auch den Vorgesetzten empfehlen.

Tatsächlich geht es in dem Aufsatz eher um Studenten – je schlechter Studenten bei einem Test abschneiden, desto mehr liegen sie bei der Einschätzung des Test daneben (natürlich bevor sie die Ergebnisse erfahren). Und zwar schätzen sie ihr Ergebnis jeweils zu hoch ein. Das Diagramm dazu sieht überzeugend aus.
Der Aufsatz ist kurz, enthält einige Diagramme, und das ist ein schöner Text, den man im Englisch-LK als Beispiel für „wissenschafltiche Prosa“ verwenden könnte, wie es im Lehrplan heißt. Für diese Textsorte habe ich tatsächlich zu wenig geeignete Beispiele, jedenfalls was empirische Wissenschaften betrifft.

— Möglicherweise bin ich bereits während der Vorbereitung auf mein Psychologie-Staatsexamen auf den Begriff der kognitiven Dissonanz gestoßen. Sicher bin ich mir nicht, vielleicht bringe ich etwas durcheinander, vielleicht brachte auch der Aufsatz, an den ich mich zu erinnern glaube, etwas durcheinander.
Darin ging es darum, dass erfolgreich Lernende ein gewisses Maß an Dissonanz aushalten können müssen. Es hilft beim Lernen von neuen Konzepten, wenn man scheinbare Widersprüche erst einmal aushalten kann. Manche Sachen kann man eben vorerst noch nicht an bisher Bekanntes anknüpfen. (Das ist möglicherweise ein Widerspruch oder eine Ergänzung zu konstruktivistischen Lerntheorien. Bin aber Laie.) Manche Puzzleteile kann man noch nicht anbauen, sondern muss sie erst mal auf einen zweiten Stapel legen.
So muss man auch damit leben können, dass es für einen Text zwei verschiedene Interpretationen gibt. Oder mit dem Welle-Teilchen-Dualismus. Tatsächlich kann so eine Dissonanz auch Lustgewinn bringen. Ich habe jahrelang an einer Brecht-Parabel geknabbert, bis ich endlich meinen Frieden mit ihr gemacht habe. („Herr K. und die Konsequenz“ – heute ist der Zauber des Unverständnisses leider dahin, aber ich erinnere mich noch gut daran.)

Damit haben wir uns aber weit entfernt von der ursprünglichen Definition des Begriffs. Mit einem abschließenden Beispiel möchte ich dazu zurückkommen:
Wenn man a) sich für einen klugen Kopf hält und b) einen Job macht, der eigentlich sinnlos ist, dann besteht die Gefahr, dass man die kognitive Dissonanz dadurch verringert, dass man sich einredet, der Job sei gar nicht so sinnlos.
Ich mein ja nur. Eventuell übernehme ich im neuen Schuljahr nämlich eine neue Aufgabe. Mehr Informationen dazu gibt es erst in einiger Zeit.