Wenn man nicht alles selber liest…

Ich lese in letzter Zeit viel gegen Noten. Angefangen hat das mit einem Kommentar zu einem meiner Blogeinträge, dann ging es weiter mit einer Diskussion im Lehrerforum, wo auf Nachfragen dann auch eine wissenschaftliche Quelle zur Behauptung „Noten sind willkürlich und nicht objektiv“ genannt wurde.
Einer Diskussion bei Twitter (sofern möglich; auf Twitter gibt es keine sinnvollen Diskussionen) folgte dieser Blogeintrag bei Forschungswege. Und heute morgen lese ich schon wieder ganz apodiktisch bei Twitter: „Noten sind Unsinn, da nicht vergleichbar, undifferenziert und als Feedback unbrauchbar.“

Ich bin ja auch sehr skeptisch, was Noten betrifft. Aber vieles von dem, was ich da lesen musste, ist falsch. (Zugegeben, die Kommentare stammen alle von Lehrern mit Schwerpunkt Grundschule, vielleicht lässt sich das auch einfach nicht übertragen auf meine Schulart.) Aber dazu später mehr in einem eigenen Blogeintrag. Heute geht es mir nur um die oben genannte Quelle zur Behauptung, Noten seien willkürlich und nicht objektiv. Die Quelle – sicher nicht die einzige, aber die einzige, die genannt wurde – war der Kommentatorin nur aus einem anderen Buch bekannt. Ich bin gestern selber in die Bibliothek und habe den Aufsatz herausgesucht: „Wie einig sind sich Lehrer bei der Aufsatzbeurteilung? Eine Replikationsstudie zur Untersuchung von Rudolf Weiss“, Peter Birkel/Claudia Birkel, in: Psychologie in Erziehung und Unterricht 49/2002, S. 219 – 224.

Hier meine Zusammenfassung des Aufsatzes:

Der Versuchaufbau

Ausgangspunkt waren vier unterschiedlich gute Aufsätze aus einer 4. Klasse, ursprünglich benotet von 2+ bis 4-. Von jedem Aufsatz wurden zwei Varianten erstellt, eine mit wenig und eine mit viel Rechtschreibfehlern. 89 teilnehmende Grundschullehrer(innen) erhielten jeweils diese vier Aufsätze – in unterschiedlichen Kombinationen von guter/schlechter Rechtschreibung. Die sollten sie dann benoten.
Den teilnehmenden Lehrern wurde Anonymität zugesichert, so dass über ihre Zusammensetzung nichts bekannt ist; ich gehe davon aus, dass sie alle aus dem gleichen Bundesland stammen (sonst wäre das Ergebnis nicht brauchbar), vermutlich Baden-Württemberg, da die Autoren in diesem Land an der Universität bzw. PH arbeiteten.

Die Lehrer erhielten keine Kriterien zur Bewertung. Zwar belegten Untersuchungen, dass mit Kriterienkatalogen „die Reliabilität der Zensuren so sehr gesteigert werden kann, dass sie nahe an die Größenordnung herankommt, die für formelle Tests gefordert wird“ (S. 220). Aber da Grundschullehrer solche Kriterienkataloge in der Regel nicht benutzten, so die Autoren, gab es auch keine bei dieser Untersuchung.

Die Ergebnisse

Die durchschnittliche Benotung aller Aufgaben entsprach äußerst gut der ursprünglich gegebenen Note.
Die Rechtschreibung spielte eine Rolle bei der Benotung; im Schnitt wurden die Aufsätze mit vielen Fehlern um eine Drittelnote schlechter benotet als die ohne.
Allerdings gab es deutliche Unterschiede bei der Einzelbenotung. Der ursprünglich mit 1- bewertete Aufsatz wurde (in der Version mit wenig Rechtschreibfehlern) von 1- bis 4- bewertet. Zugegeben, von 37 Lehrern gab es die Note 1 bis 2-3, nur von 1 Lehrer die Note 4-. (Zum Herumhacken auf den Tendenzen: Es geht wohl um Baden-Württemberg, und zumindest damals wurde die Note 2+ als 1.75 gewertet und die Note 2- als 2.25 – in Bayern gibt es nur volle Noten.)
Ähnliche Streuung – also Note 1-5 für den selben Aufsatz gibt es auch bei den anderen Aufsätzen, am wenigsten bei dem ursprünglich mit 4- benoteten Aufsatz. Es sind zwar jeweils nur wenige Ausreißer, aber die sind nun einmal da.

Interpretation der Ergebnisse

„Offenbar ist es wohl leichter, bei einer schlechten Leistung ein größeres Maß an Übereinstimmung zu erreichen als bei mittelmäßigen oder guten Leistungen!“ (S. 223). Das deckt sich übrigens mit meiner Erfahrung; ob eine Leistung ausreichend ist (1-4) oder nicht (5-6), das kann ich selber auch leichter entscheiden als den Grad dessen, wie sehr sie ausreicht beziehungsweise sehr gut ist. Insofern ist es etwas schade, dass keine nicht ausreichenden Leistung in die Untersuchung einbezogen wurden.

Weiterhin bemängeln die Autoren der Studie, dass die Rechtschreibleistung signifikant bei der Bewertung des Aufsatzes eine Rolle gespielt habe. Sie schließen daraus, dass wenn man bei der Bewertung eines Aufsatzes Schwierigkeiten hat (und die hat man immer, sage ich, leicht ist das nicht), gerne auf leichter zu bewertende, aber irrelevante Merkmale wie Anzahl der Rechtschreibfehler oder Geschlecht des Schülers ausweicht. Uh? Ich gehe davon aus, dass es in Baden-Württemberg zumindst damals in der 4. Klasse so war, dass Rechtschreibung explizit nicht in die Aufsatzbewertung einfließen sollte, oder habe ich das missverstanden? Das kann ich mir eigentlich gar nicht vorstellen.

Die Autoren der Studie sagen zur großen Spannbreite bei den Noten: „Kriterienkataloge könnten hier Abhilfe schaffen!“ (S. 223), aber Grundschullehrer würden im Studium nichts davon hören und sie deswegen auch in der Praxis nicht anwenden. Bisher hätte die „Anwendung solcher Kriterien eher im Bereich der Sekundarstufe Eingang gefunden […] und ihren Wert bewiesen.“ Ein weiterer Grund könne sein, dass in der Grundschule oft fachfremd Deutsch unterrichtet werde; kein Wunder, dass diese Lehrkräfte nichts von Kriterienkatalogen hielten.

Mein Kommentar

Es ist interessant, dass die Durchschnittsnote der Aufsätze sehr genau den ursprünglich gegebenen Noten entspricht. Man könne der Lehrerin, die die Aufsätze ursprünglich benotet hat, „ein Kompliment machen“ (S. 223). Nicht nachgegangen wird der Frage, wie das zu erklären ist. Gibt es manche Lehrer, die doch objektiv benoten können? Zeichnet sich diese ursprünglich ausgewählte Lehrkraft durch bestimmte Merkmale aus? Oder ist es einfach wahrscheinlich, eine Lehrkraft zu erwischen, die genauso benotet wie der Durchschnitt der Lehrkräfte?

Was nicht untersucht wird: Hatten die die jeweiligen Lehrkräfte eigene Kriterienkataloge, implizit oder explizit? Waren diese Kriterien den Schülern und Schülerinnen bekannt? Objektivität müsste man eher dadurch messen, dass ein Aufsatz von derselben Lehrkraft mit einem Abstand von einem Jahr benotet wird, und nicht durch Vergleich mit anderen Lehrkräften mit anderen expliziten oder impliziten Kriterienkatalogen. Sicher auch kein einfacher Versuchsaufbau.

Insgesamt: Schön zu lesen. Das steckt Interessantes drin. Für ein pauschales: „Aufsatznoten sind willkürlich und nicht objektiv“ ist der Aufsatz allerdings keinesfalls Beleg und will es auch nicht sein.

Sind Noten möglicherweise trotzdem willkürlich und nicht objektiv? Kann sein. Andere Untersuchungen zeigen das vielleicht. Aber den nächsten Aufsatz überprüft dann bitte jemand anderes.

Tagged: Tags

38 Thoughts to “Wenn man nicht alles selber liest…

  1. Danke für Deine Mühe, die Untersuchung im Original zu lesen und zu kommentieren. Soweit ich Einblick habe, gibt es hier in den Grundschulen tatsächlich einen Kriterienkatalog für die Bewertung von Aufsätzen. Dieser Katalog wird den Schülern mit dem bewerteten Text ausgehändigt. Das macht die Benotung zumindest nachvollziehbar.
    Im Sinne der sog. Positiven Pädagogik (http://kristinalucius2.wordpress.com/2013/10/08/burow-positive-padagogik/) fände ich es für Lehrer, Eltern und Schüler besser, den unsäglichen (Noten-)Druck aus der Schule zu nehmen und den Blick noch mehr auf das Können der Schüler zu richten.

  2. So, so …. Grundschullehrer benutzen also keine Kriterienkataloge. Es wird die Kollegen am Gymnasium vielleicht überraschen: Die verschiedenen Aufsatzformen werden anhand von Kriterien erarbeitet, mithilfe der schriftlich vorliegenden Kriterien von den Schülern geübt und teilweise (z.B. bei Schreibkonferenzen) von den Schülern selbst zur Beurteilung eigener Ergebnisse herangezogen. Anhand dieser Kriterien werden selbstverständlich auch die Probeaufsätze beurteilt. Ich für meinen Teil klebe die Tabelle mit den einzelnen Kriterien und den entsprechenden Punkten zur Information der Eltern sogar auf die Probe. Es ist ermüdend, immer wieder lesen zu müssen, welches Bild die Gymnasiallehrer von den Grundschulkollegen haben. Aber selbstverständlich hat Fachwissenschaft einzig und allein am Gymnasium eine Heimat.

    Aber selbst wenn die Noten alle Gütekriterien erfüllen würden, könnte ich auf die Noten in der Grundschule gut verzichten. Meiner Erfahrung nach zerstören wir mit dem Druck in der 4. Jahrgangsstufe (ich habe diese nun zum dritten Mal in fünf Jahren) die Freude an der Schule und auch die „richtige“ Motivation.

  3. Uh, Lesekompetenz? Eine Grundschullehrerin hat mir den Aufsatz genannt als Beleg dafür, dass Noten willkürlich sind. Ich habe den Aufsatz zusammengefasst. Dort sagen die Autoren des Aufsatzes – PH Weingarten, Universität Konstanz – dass Grundschullehrer keine Kriterienkataloge kennen. WO SOLL ICH… Wo soll ich als Gymnasiallehrer irgendwas gegen Grundschullehrer gesagt haben? Dann dürft ihr mir diesen Aufsatz nicht als Beleg für Thesen nennen, wenn ich ihn nicht lesen darf. Die Empfindlichkeit der Grundschullehrer scheint mir mindestens so groß zu sein wie das Ermüdung erzeugende Bild der Gymnasiallehrer von ihnen.

    Tät mich ehrlich gesagt ja auch wundern, wenn es keine Kriterienkataloge am Deutschunterricht der Grundschule gäbe. Mir sind sie im Studium (1. Hälfte der 1990er Jahre) fürs Gymnasium übrigens tatsächlich auch begegnet. Zur Veramtlichung der Note dürfen wir sie allerdings nicht heranziehen (sondern nur zu Erklärung für die Eltern), da gilt immer noch das verpflichtende Wortgutachten unter dem Aufsatz.

  4. Vielleicht hat meine fehlende Lesekompetenz ihre Ursache in der Vermischung von Zusammenfassung und Bewertung. Denn im gleichen Absatz heißt es: „ich gehe davon aus, dass sie alle aus dem gleichen Bundesland stammen (…)“ usw. Deshalb hielt ich auch die nachfolgenden Sätze in diesem Aufsatz für die Meinung des Autors.

    Es tut mir natürlich leid, wenn ich Ihnen da fremde Gedanken untergeschoben habe …

  5. Wenn ich mich recht erinnere, ist mir während meines Studiums eine Untersuchung begegnet, in der Mathematikarbeiten von den gleichen Lehrern zu unterschiedlichen Zeiten unterschiedlich bewertet wurden.
    Ein (halbherzig durchgeführtes) googlen brachte aber nur eine Studie aus dem Jahr 1927 zu Tage. In der Auswertung durch den Mathematikdidaktiker Walther Lietzmann kann man zumindest lesen:
    „Verschiedene Lehrer geben gleichen Arbeiten verschiedene Noten. Derselbe Lehrer gibt zu verschiedenen Zeiten der gleichen Arbeit verschiedene Noten.“

    Das würde zumindest dem Kritikpunkt neue Gründe geben.
    Ähnlich wie die Demokratie „als eine schlechte Regierungsform, aber von allen Regierungsformen die am wenigsten schlechte“ bezeichnet wird, halte ich die Notengebung für schlecht – aber für die am wenigsten schlechte Möglichkeit, um den verschiedenen Funktionen gerecht zu werden.
    (s.a. http://wp.me/p1Ofoo-1gY ;-))

    Quelle: „Problematik der Zensurengebung und alternative Formen der Leistungsbeurteilung“ von Björn Fehrenbacher

  6. Heutzutage ist es bei vielen Grundschullehrern wohl auch üblich, mit Kriterienkatalogen zu arbeiten. Die Studie ist aber von 2002, da war es scheinbar noch nicht so.

    Markus

  7. Das habe ich im Web dazu gefunden:

    Fehler beim Benoten
    1. Verschiedene Lehrer beurteilen ein und dieselbe Arbeit verschieden, und zwar in allen Fächern. „Allgemein bekannt sind die enormen Schwankungsbreiten in der Beurteilung mündlicher Leistungen und von Aufsätzen. Weniger bekannt ist, dass es auch in Mathematik erhebliche Divergenzen zwischen den Beurteilungen verschiedener Lehrer gibt.“ Lehrer beurteilen dieselbe Arbeit anders, wenn sie ihnen ein zweites Mal vorgelegt wird.

    http://www.uni-online.de/artikel.php?id=5272

    Aber es gibt dort keine weiteren Links. Die Autorin war wohl Gymnasiallehrerin und sollte deshalb wissen, was sie zur Notengebung schreibt und bestätigt, dass Noten nicht objektiv sind. Für mich klingt das vernünftig und bestätigt meine eigenen Erfahrungen damit.

  8. Hm, ja. Dieser Link ist für mich ein bisschen vergiftet. Ich hatte hier mal einen Eiferer/Troll in der Kommentaren, der sich immer daraus bedient hat. Und dieser Quasi-Selbstverlag sieht auch nicht beeindruckend aus. Ich habe das Vorwort angelesen, sehr emotional, aber das war vielleicht nur der Anfang. Wie lobt ein Kommentator bei Amazon: „Dieses Buch setzt meine Meinung perfekt um.“ Das erwartet man von einem Fachbuch ja. „Allgemein bekannt“ ist jedenfalls ganz unsauber, aber vielleicht wird das ja doch noch besser belegt, mit Birkel/Birkel etwa.

    Zumindest einige der im Link genannten Thesen – ich habe diesmal nicht alle gelesen – sind Quatsch. Bei Nummer 14 etwa kann man nur den Kopf schütteln. Das macht es insgesamt schwer, das Buch ernst zu nehmen. (Nachtrag: Mindestens 11, 12, 13 sind auch Quatsch.)

    Dass die Autorin Gymnasiallehrerin war, heißt nicht, dass sie „deshalb“ schon weiß, was sie zur Notengebung schreibt. Es gibt sicher viele Gymnasiallehrer, die eine andere Meinung haben als sie, gilt für die das „deshalb“ dann nicht?

    — Trotzdem kann natürlich stimmen, was in dem Buch steht; ich habe es nicht gelesen. Die reißerische Übertreibung der Aussagen verdeckt, dass tatsächlich viel an Notengebung zu kritisieren ist. Ich wünsche mir selber da auch eine Änderung.

  9. Ein vielleicht banaler Nachtrag:
    Wir versuchen im Kollegium für das Fach Deutsch zunächst häufig in verschiedenen Kursen die gleiche Klausur schreiben zu lassen und legen die Kriterien vorher in einem Korrekturbogen fest. Dabei orientieren wir uns an den Kriterien des Zentralabiturs in NRW. Im Anschluss lässt sich dann nach der Korrektur der Klausur zumindest ein Vergleich auf Basis identischer Kriterien anstellen und es kann auch leichter nachvollzogen werden, ob man auch die gleichen Noten gegeben hätte. Das alles ist noch weit von reiner Objektivität entfernt, ist aber ein Ansatz.

  10. „Aber den nächsten Aufsatz überprüft dann bitte jemand anderes.“

    Das habe ich mir sofort zu Herzen genommen und stelle hier einen Punkt deines angeblich „vergifteten“ Links zur Diskussion:
    Dazu greife ich lediglich den Punkt der schlechteren Beurteilung von Jungs auf, den die Autorin anführt, um auf die mangelte Aussagekraft von Noten hinzuweisen.

    Studie: Bildungs-miss-erfolge von Jungen / Bildungsforschung Band 23

    http://www.bmbf.de/pub/Bildungsmisserfolg.pdf

    Das Wichtigste in Kürze:

    •Vergleicht man in unterschiedlichen Fächern die Leistungen bei gleichem Interesse, zeigen sich nur geringe Kompetenzdifferenzen.
    •In allen Fächern erhalten Jungen auch bei gleichen Kompetenzen schlechtere Noten.

    3.1 Leistungen im Fach Deutsch

    Für das Fach Deutsch liegen zahlreiche Studien vor, die sich schwerpunktmäßig auf die ersten Jahre der Schullaufbahn beziehen. Lesen und Verstehen von Texten stellt eine grundlegende Schlüsselqualifikation für alle Formen des Lernens, des Aufbaus von Wissensstrukturen, schulischen Erfolg wie auch für gesellschaftliche Teilhabe dar.

    Das Wichtigste in Kürze:

    • Zu Beginn der Schullaufbahn zeigen Jungen gute Deutschleistung, in der 5. Klasse findet sich dann ein moderater Rückstand zu den Mädchen, der in der Jahrgangs­stufe 9 zunimmt; in der Oberstufe findet sich wieder eine Annäherung.
    • Beim Wortschatz finden sich kaum Geschlechterdifferenzen, bei freier Textproduk­tion und in der Rechtschreibung haben Jungen Probleme, je weiter die Worte von ‚Jungenwelten‘ entfernt sind, umso größer sind die Schwierigkeiten.
    • Die geringeren Leistungen im Deutschunterricht beeinflussen auch andere Schul­fächer negativ.
    • Bei gleicher Motivation und gleichem Selbstkonzept zeigen Jungen auch gleiche Leistung wie Mädchen.

    Besonders groß sind jedoch bereits am Ende der 4. Klasse die Schwierigkeiten in den Bereichen literarischer und argumentierender Texte (vgl. Bos u.a. 2003 16), sowie im freien Schreiben (vgl. Lehmann u.a. 1996 [LAU 5]). Die freie Anwendung der deut­schen Sprache stellt Jungen also vor vergleichsweise größere Probleme. Gudrun Spitta weist in diesem Zusammenhang auf den interessanten Aspekt hin, dass Jungen bereits ab der 3. Klasse im Deutschunterricht häufiger Geschichten schreiben, in denen ein Held Bedrohungen von Außen (Feinde, Außerirdische etc.) abwendet. Lehrkräfte inter­pretieren diese Handlungen oftmals als gewalttätig und bewerten sie tendenziell schlechter (vgl. Spitta 1996: 23). Relativ gute Erfolge erzielen Jungen hingegen in dis­kontinuierlichen Texten bspw. bei Grafiken und Tabellen

    Mit dem Übergang in die Sekundarstufe I steigert sich der Vorsprung der Schülerinnen kontinuierlich. Während zu Beginn der 5. Klasse innerhalb der unterschiedlichen Schul­formen aufgrund des dreigliederigen Schulsystems kaum Differenzen existieren, erge­ben sich für die Jungen in der 7. Klasse Schwierigkeiten.

    Dies bedeutet ande­rerseits, dass der Vorsprung der Mädchen insbesondere am Gymnasium und in den oberen Kompetenzstufen gravierend ausfällt. Auch vielen leistungsstarken Jungen gelingt scheinbar im sprachlichen Bereich nur eine geringe Zunahme.

    So fällt der Leistungsrück­stand der Jungen geringer aus, wenn nicht die Gesamtmenge aller Fünfzehnjährigen miteinander verglichen, sondern je bundeslandspezifisch ausgewertet wird.
    Während sich die Differenz dann in Bayern, Sachsen oder Brandenburg noch immer gravierend darstellt, ist sie in NRW oder Schleswig-Holstein nicht einmal mehr gegen zufällige Einflussfaktoren abgesichert – d.h. nicht signifikant. Bemerkenswert sind die schlech­ten Ergebnisse der Jungen aus Ostdeutschland, die Zusammenhänge mit den schlech­teren Schulabschlüssen vermuten lassen. Dieser Befund deckt sich mit einer anderen Erkenntnis der PISA-Studie, nach der die Deutschkompetenzen der Jungen insgesamt ansteigen, wenn die Zahl der Jungen am Gymnasium hoch ist. Da dieser Anteil in den fünf östlichen Bundesländern sehr gering ausfällt, ist auch ihr Gesamtabschneiden stark unterdurchschnittlich (vgl. Deutsches PISA-Konsortium 2001).

    Die Deutsch-Englisch Schülerleistung International-Studie (DESI), die ca. 11.000 Schülerinnen und Schüler sowie Lehrkräfte und Eltern aller Schularten zu Deutsch­ und Englisch-Leistungen in der 9. Klasse befragt, bestätigt diese Kompetenzunter­schiede (vgl. Klieme u.a. 2006). Zusätzlich verweist sie darauf, dass der Rückstand der Jungen im Bereich der Textproduktion größer ausfällt als beim Lesen oder der Sprach­bewusstheit, kaum Unterschiede existieren im Wortschatz (vgl. Klieme u.a 2006: 20).

    Die geringeren Kompetenzen hängen mit teilweise geringerem Selbstkonzept und niedrigerer Motivation zusammen. So fasst Christina Garbe in einem differenzbetonen­ den Aufsatz zusammen,

    Das negative Selbstkonzept korrespondiert mit der Erwartungshaltung von Lehr­kräften. Dies hat teilweise gravierende Folgen, denn die Unterstellung schlechterer Lei­stungen und geringerer Motivation überschneidet sich mit der Tatsache, dass Jungen bei gleicher Kompetenz tendenziell schlechtere Noten erhalten als Mädchen. Auch Eltern schätzen Jungen schlechter und vor allem unmotivierter ein als Mädchen, auch wenn beide über das gleiche Kompetenzniveau verfügen (vgl. Bos u.a. 2003). So ent­wickelt sich ein Zirkelschluss aus negativer Selbst- und Fremdzuschreibung, der in der Sekundarstufe I die oben beschriebenen Auswirkungen zeigt.

    Leistungen im fremdsprachlichen Bereich

    Das Wichtigste in Kürze:

    • Im Fach Englisch finden sich kaum genderspezifische Kompetenzunterschiede, obwohl es ein sprachliches Fach ist.
    • Jungen haben im mündlichen Bereich und in Fachenglisch besondere Stärken.

    Der Kommunikationsfähigkeit in Englisch als dominierende Weltsprache kommt eine stetig wachsende Bedeutung zu.

    Gleichzeitig gehört Englisch zu den sprachlichen Fächern, in denen Jungen häufiger Probleme nachgesagt werden.

    http://www.bmbf.de/pub/Bildungsmisserfolg.pdf

    Alles in allem sieht es für mich, nach der Lektüre dieser Studie wirklichdanch aus, als müssten wir unsere Beurteilungskriterien grundsätzlich in Frage stellen, wollen wir die aktuell falsche Selektion der Jungs wieder rückgängig machen.

    Zu den anderen Punkten kann ich nur anmerken, dass mir die Argumentation das sei alles Quatsch, etwas dünn erscheint, besonders vor dem Hintergrund eines hochselektiven Systems, das sich auf die Fahnen schreibt, am Ende die Besten aus dem System zu entlassen.
    Zweifelhaft ist das Selektionsergebnis sowieso vor dem Hintergrund, dass Bundesländer die eine angeblich oder tatsächlich leichtere Abiturprüfung durchführen, einen höheren Anteil an guten Noten stellen und so ihre Abiturienten in eine bessere Startposition bei NC-Fächern und Arbeitgebern bringen.

  11. Sehr gute Zusammenfassung! Statt „Wir kochen Kürbissuppe …“ sollte meine nächste Vorgangsbeschreibung vielleicht „So bastle ich den perfekten Papierflieger …“ heißen.

    Vielleicht fragen wir aber auch insgesamt die falschen Dinge ab???

  12. Karlheinz Ingenkamp hat dazu viel geforscht und geschrieben, u. a. „Die Fragwürdigkeit der Zensurengebung“ (Beltz, 1. Auflage 1977).
    In seinem „Lehrbuch der pädagogischen Diagnostik“ (Beltz, 1985) erwähnt er eine Studie zur Bewertung von Mathematikarbeiten von Starch und Elliot. Mathematik wählte man, da man sich hier am ehesten eine „objektive“ Bewertung erhoffte. Die Studie stammt aus den Jahren 1912/13 (S. 107). Die mangelhafte Auswertungsobjektivität selbst in diesem Fach wurde danach noch mehrfach bestätigt, die letzte im Buch aufgeführte Studie stammt von 1971. Auch die Studie von Weiss zur Aufsatzbewertung, die Birkel und Birkel 2002 reproduzieren konnten, wird in diesem Zusammenhang kurz beschrieben.
    Interessant dieses Zitat:
    „Die Zahl der Untersuchungen, in denen die mangelnde Auswertungsobjekitivtät schriftlicher Arbeiten in allen Unterrichtsfächern übereinstimmend nachgewiesen wurde, ist so groß, daß hier nicht einmal die Autorennamen angeführt werden können.“ (ebd. S. 108)
    Auch der Grundschulverband hat dazu etwas veröffentlicht:
    „Sind Noten nützlich – und nötig? Ziffernzensuren und ihre Alternativen im empirischen Vergleich“
    http://www.grundschulverband.de/fileadmin/bilder/Publikationen/Grundschuleltern/GSE-8._Auszug.wiss._Expertise._Noten.GSE.pdf
    Angefügt sind 33 Seiten Quellen und weiterführende Literaturempfehlungen.

    Zur Nicht-Vergleichbarkeit von Zensuren:
    Ich bezog mich dabei nicht auf die Ergebnisse einzelner schriftlicher Arbeiten (das bekommt man noch ganz gut hin, besonders, wenn man vorgegebene und mit Statistik unterfütterte Lernzielkontrollen einsetzt (das gibt es in der GS in Mathematik tatsächlich!)), sondern auf die Halb- oder Ganzjahreszensuren, in denen mehrere Beurteilungen zusammengefasst werden.

    Meist geht in die Zeugnisnote die mündliche Mitarbeit ein. Mit welcher Gewichtung, bleibt der Fachkonferenz überlassen und wird dem Leser des Zeugnisses nicht offenbart.
    Nun steht da eine 3, also ein „befriedigend“.
    Eine 3 bekommt ein Schüler/eine Schülerin, wenn er/sie in den schriftlichen Leistungskontrollen konstant 3 erreicht, und sich „befriedigend“ beteiligt (Was ist das: „befriedigend“? Wie häufig muss man sich melden? Welche Qualität müssen die Beiträge besitzen?).
    Auch mit einer schriftlichen 4,5 kann man noch auf dem Zeugnis eine 3 erreichen, wenn man mündlich mindestens 2- steht (Annahme: schriftlich/mündlich werden zu je 50% gewertet, meist hat die mündliche Mitarbeit aber ein stärkeres Gewicht).
    Und auch dieser Fall kommt vor:
    Ein Schüler liefert in allen schriftlichen Arbeiten eine 1 ab, beteiligt sich aber – aus welchen Gründen auch immer – nur selten mündlich und wird mit 4 benotet. Auch er erhält eine 3 (rechnerisch 2,8 bei mdl./schrftl.: 60%/40%) (dieser Fall ist nicht fiktiv!)
    Der uninformierte „Abnehmer“ des Zeugnisses vermutet bei allen drei Schülern die gleiche Leistung in Mathematik, das gleiche fachliche Können und setzt dabei seinen eigenen „inneren“, an seiner eigenen Schulerfahrung genormten Maßstab für eine 3 an.
    Ich hoffe, es wird nun deutlicher, was ich mit „nicht vergleichbar“ und „undifferenziert“ meinte.
    Eine (noch) ausführlichere Begründung meiner Ansicht schiebe ich in meinem Blog nach.

  13. Jo, ich hatte mir da etwas anderes erhofft als Copy & Paste einer Zusammenfassung.
    — Ich habe mir vor allem Deutsch angeschaut; dort steht, dass Jungen geringere Leistung zeigen als Mädchen. Da scheint es um Leistung zu gehen, nicht um Noten. Man kann sich fragen, woher die geringere Leistung kommt, und etwas dagegen tun – aber dass die Noten nicht zur Leistung passen, das steht nur einmal oben pauschal: „In allen Fächern erhalten Jungen auch bei gleichen Kompetenzen schlechtere Noten.“ Ich kann mir das in dieser Pauschaliät nicht wirklich vorstellen (alle Länder, Fächer, Schularten, Jahrgangsstufen?), aber dass da etwas dran ist, das halte ich für gut möglich. Woran liegt das? Was sollte man dagegen tun? (Noten abschaffen?) Steht dazu etwas drin?

    >die Argumentation das sei alles Quatsch, etwas dünn erscheint

    Nicht alle dieser – uh, was eigentlich, Thesen, Behauptungen, Gründe? drüber steht „Fehler beim Benoten“ – nicht alle dieser „Fehler beim Benoten“ sind Quatsch. Einigen stimme ich durchaus zu. Aber Nummer 14, der erste in meiner Liste oben, ist Quatsch. Gegen die Normalverteilung kann man tatsächlich viel sagen (habe ich hier im Blog schon getan). Aber dass die Notenschnitte mit jeder Klassenstufe steigen müssen, weil immer mehr Schüler „aussortiert“ werden, hat damit nichts zu tun. Sonst müsste man konsequenterweise auch verlangen, dass nach der Grundschule in der Mittelschule nur schlechte, in der Realschule nur mittlere und am Gymnasium nur gute Noten verteilt werden.

  14. Wie ich zu Noten stehe (differenziert), habe ich bei Kristina Lucius ja schon geschrieben; irgendwann kommt mal ein Blogbeitrag.

    Ich halte die Aussagekraft von großen (i.e. angekündigten) Leistungserhebungen für mittel. Ich halte sie für objektiv und reliabel, bin mir bei der Validität aber nicht ganz so sicher. Birkel & Birkel nennen Quellen für die Reliabilität von Aufsatzkorrektur, das steht jetzt mal gegen Ingenkamp S. 108, mehr kann ich im Moment nicht sagen. Du schreibst ja selber, dass du diese Notern „noch ganz gut hin“ kriegst.

    Der Aussagekraft von kleinen Leistungserhebungen, insbesondere – aber nicht nur – mündlichen misstraue ich deutlich mehr. (Punktuelle Erhebung, unterschiedlicher Schwierigkeitsgrad, unterschiedliche Aufgaben.) Sehr viel mehr.

    In Bayern ist deren Gewichtung aber nicht der Fachkonferenz überlassen, sondern steht fest. Auch die Häufigkeit der Beiträge darf in Bayern gar keine Rolle spielen; nur deren Qualität. Mitarbeitsnoten im anderswo üblichen Sinn gibt es hier nicht.

    Das Problem mit den Zeugnisnoten hat aber weniger mit den kleinen mündlichen Noten zu tun als damit, dass für verschiedene Fähigkeiten eine gemeinsame Note gegeben werden soll. Dafür reichen die großen schriftlichen Prüfungen auch schon, die ja zumindest in Deutsch verschiedene Fähigkeiten prüfen. Das ist so, als würde man für Informatik und Biologie eine gemeinsame Note vergeben. (Passiert in Bayern leider tatsächlich.)

    Deswegen Zeugnisnoten generell als nicht vergleichbar zu bezeichnen, halte ich für übertrieben. Sie sind ungenau, das auf jeden Fall. Aber sie bieten einen Anhaltspunkt. Gibt es Forschung zur Kontinuität von Zeugnisnoten? Ich denke nämlich, dass Zeugnisnoten sich nicht so sprunghaft ändern, wie das gerne mal kolportiert wird. Das würde dafür sprechen, dass man aus Zeugnisnoten schon etwas lesen kann – was, das ist eine andere Frage.

  15. Thomas, die Aussage, „Zu Beginn der Schullaufbahn zeigen Jungen gute Deutschleistung, in der 5. Klasse findet sich dann ein moderater Rückstand zu den Mädchen, der in der Jahrgangs­stufe 9 zunimmt; in der Oberstufe findet sich wieder eine Annäherung.“, widerspricht deiner Behauptung, „Ich habe mir vor allem Deutsch angeschaut; dort steht, dass Jungen geringere Leistung zeigen als Mädchen.“ vor allem darin, dass es zwar einen Kompetenzeinbruch bei den Leistungen gibt, diese allerdings am Ende nivelliert werden.

    Ausser in Bayern, (+S…), denn hier sagt die Studie: „So fällt der Leistungsrück­stand der Jungen geringer aus, wenn nicht die Gesamtmenge aller Fünfzehnjährigen miteinander verglichen, sondern je bundeslandspezifisch ausgewertet wird.
    Während sich die Differenz dann in Bayern, Sachsen oder Brandenburg noch immer gravierend darstellt, ist sie in NRW oder Schleswig-Holstein nicht einmal mehr gegen zufällige Einflussfaktoren abgesichert – d.h. nicht signifikant.“
    Was heissen könnte, dass die Noten der Mittelstufe keine Relevanz für das Abitur haben, ausser man selektiert unter der Annahme von falschen Prämissen schon vorher, wie z.B. in Bayern, aus.

    „… anderes erhofft als Copy & Paste …“
    Welche Hoffnungen und Wünsche du in diesem Fall hegtest, war für mich in diesmal nicht wirklich relevant. Prioritär für einen konkreten Erkenntnisfortschritt sind für mich die Fakten und weniger deren hübsche Neuformulierung. Nicht an einem so sonnigen Herbsttag wie gestern. ;)

  16. @Jo
    >Welche Hoffnungen und Wünsche du in diesem Fall hegtest, war für mich in diesmal nicht wirklich relevant.

    Dann solltest du dich nicht mit „Das habe ich mir sofort zu Herzen genommen“ explizit auf meinen Wunsch berufen.

    Zu den Zitaten oben: Vielleicht missverstehen wir uns oder einer den Text. Bei der genannten Leistungsschwäche der Jungen (gerne nur in der Mittelstufe) ging es mir um das Wort „Leistungen“. Sinken (gerne nur in der Mittelstufe) die Noten der Jungen, oder die Leistung, oder explizit nur eines davon (was fehlende Objektivität bedeutete)?

    @frandevol
    Weiß schon, damit hat die Diskussion mit Kristina auf Twitter ja begonnen. Im Artikel ist nur von Korrelation die Rede. Was können wir aus der Korrelation schließen? Unter dem Link „Immer wieder fordern Experten“ steht ein Link auf einen Artikel zu Sabine Czerny, der ich nicht mehr Expertentum zugestehe als vielen meiner Kollegen.

  17. Dann solltest du dich nicht mit “Das habe ich mir sofort zu Herzen genommen” explizit auf meinen Wunsch berufen.
    HAHA!
    “Aber den nächsten Aufsatz überprüft dann bitte jemand anderes.”
    Da klaube ich doch gerne auch die Worte zusammen, wie sonst im Herbst die Blätter.
    … und berufe mich noch immer auf deine Worte, denn meine „Überprüfung“ hat explizit ergeben, dass deine Behauptungen auf schwachen Beinchen zu stehen scheinen. Mit eigenen Worten, kurz, zusammengefasst und aus fremden Federn, ausführlich (s.o.), zitiert.

    „Sinken (gerne nur in der Mittelstufe) die Noten …“
    Ich sehe schon, du bleibst gerne beim Detail hängen und lässt das grosse Ganze dann das grosse Ganze sein. Und den lieben Gott einen guten Mann.
    Falls wir Noten nicht lediglich als unbedeutende Momentaufnahme sehen und isoliert von Rest der Welt, dann dürfen wir uns auch mal fragen, was diese Prinzipienreiterei eines Systems soll, das am Ende nachweislich weniger erfolgreich ist als andere.
    Angefangen damit, dass es in erfolgreicheren Bildungsnationen weniger Frühpensionen/-verrentungen bei Lehrern gibt. Kein Sitzenbleiben. Eine niedrigere Analphabetenrate. Mehr und erfolgreichere Bildungsabschlüsse. Eine höhere Zufriedenheit der Schüler und Eltern. Ein höheres Ansehen des Lehrers an sich und des Lehrerberufes überhaupt.

  18. Ich wiederhole meine Frage: Was ist mit sinkenden „Leistungen“ gemeint, die Note oder die Leistung? Ich war von der Leistung ausgegangen. Damit ist noch nichts über die Gerechtigkeit von Noten ausgesagt. Es ging doch darum, dass Noten ungerecht oder falsch sind, dachte ich. Und nicht um Frühpensionierungen von Lehrern. Ja, da sehe ich wirklich lieber das Detail als das große Ganze.

  19. Oh… mir öffnen sich andere Links im Artikel. Mag am Firefox liegen ;)
    „Soziale Ungleichheit: Auch Herkunft wird benotet“ von Frauke Lüpke-Narberhaus berichtet über eine Meta-Studie der Bildungsforscher Kai Maaz von der Uni Potsdam, Ulrich Trautwein von der Uni Tübingen und Franz Baeriswyl von der Uni Freiburg (Schweiz) und hat eine schöne Fotostrecke.
    http://www.spiegel.de/schulspiegel/wissen/soziale-ungleichheit-auch-herkunft-wird-benotet-a-803605.html
    Oliver Trenkamp verweist in “ Grundschullehrer-Vorurteile: Kevins bekommen schlechtere Noten“ auf eine Studie aus Oldenburg.
    http://www.spiegel.de/schulspiegel/wissen/ungerechte-grundschullehrer-auch-der-intelligente-kevin-ist-dumm-dran-a-649736.html

    Zu der aktuell beschriebenen Studie: wie belastbar die Ergebnisse sind, wird man wohl erst nach der Veröffentlichung prüfen können.
    ( http://www.zfs-online.org/ )

  20. Wie jemand schon geschrieben hat, ist die Schwammigkeit vieler Bewertungskriterien ein echtes Problem – genau, was heißt „Befriedigend“? Schaut auch bei anderen Noten nicht besser aus. Wann entspricht eine Leistung „in besonderem Maße“ den Erwartungen? Was ist „über das im Unterricht erwartete Maß hinaus“? Das kann doch jeder nur für sich interpretieren!
    In Bewertungsbögen, auch von Schulen offiziell verwendeten, geht es lustig weiter: wann ist ein Aufsatz z. B. „pfiffig“? Aber hallo? Sie, ich, und jeder Kommentator würden „pfiffig“ wahrscheinlich aufgrund unserer Erfahrungen etwas anders definieren. Jede Lehrkraft wahrscheinlich auch.

    Man kann auch mal versuchen, das Ganze auf den eigenen Unterricht anzuwenden: ist meine heutige Unterrichtsstunde „pfiffig“? „Befriedigend“? „in besonderem Maße“ den Erwartungen entsprechend? Da merkt man schon die Absurdität des Ganzen.

    That said – Noten, scheint der Konsens zu sein, sind nicht sinnlos. Aber an der Art, wie Noten gegeben und „festgezurrt“ werden (insbesondere mündliche Noten!) könnte man wahrscheinlich relativ lange relativ viel herumbasteln.

  21. „Was ist mit sinkenden “Leistungen” gemeint, die Note oder die Leistung? “

    Das Wichtigste in Kürze (sagt die Studie):

    •Vergleicht man in unterschiedlichen Fächern die Leistungen bei gleichem Interesse, zeigen sich nur geringe Kompetenzdifferenzen.
    •In allen Fächern erhalten Jungen auch bei gleichen Kompetenzen schlechtere Noten.

    Zu Noten insgesamt kann man sagen, dass es funktionierende Konzepte gibt, die ohne auskommen und trotzdem funktionieren. Oder sogar besser funktionieren? Vielleicht weil Noten, im Sinne des Erfinders der Selektion, nicht funktionieren? Weil sie krank machen? Egoismus fördern? Egozentrik verstärken? Machtverhältnisse etablieren? Demotivieren? Lernfreude hemmen?

  22. Will mich nicht unnötig einmischen, bin eh fachfremd (wobei wir an der Uni ja auch hin und wieder Noten vergeben, aber das ist doch insgesamt alles sehr verschieden zu dem was an der Schule passiert). Eine Frage ist für mich Unwissenden dann doch aufgetaucht:

    Was sind nochmal die Konkurrenzsysteme zu Noten?

    Genauer: Was ist sonst der Deal? Wird Leistung trotzdem gemessen (wie ungenau auch immer), oder einfach gar nicht?

    Nur so Interesse halber…

    Und ein letzter noch: Ich bin in der (öfter mal für erfolgreich erklärten) Bildungsnation Schweden zur Schule gegangen. Da gab es Noten.

  23. „Zu Noten insgesamt kann man sagen, dass es funktionierende Konzepte gibt, die ohne auskommen und trotzdem funktionieren. Oder sogar besser funktionieren? Vielleicht weil Noten, im Sinne des Erfinders der Selektion, nicht funktionieren? Weil sie krank machen? Egoismus fördern? Egozentrik verstärken? Machtverhältnisse etablieren? Demotivieren? Lernfreude hemmen?“

    Sorry, das ist mir einfach zu über-einen-Kamm-geschoren.
    Ich habe, z. B., wie die meisten anderen meiner Generation, Noten bekommen, und habe mich auch nach 12 Jahren Benotung weder krank, noch besonders egoistisch, egozentrisch, ausgebeutet, demotiviert oder in meiner Lernfreude gehemmt gefühlt.

    Ich würde jetzt mal sagen, meine Klassenkameraden und ich haben ab der Pubertät Noten von einer wesentlich weniger abgehobenen und viel pragmatischeren Seite betrachtet. Noten waren Teil des Deals – man wollte auf diese Schule gehen, in manchen Fächern wollte man sogar etwas lernen, und dann wurde man eben benotet. Ohne gewisse Noten kein Aufsteigen, das war sehr klar. Man konnte selbst entscheiden, was man bereit war, für Noten zu tun, und was nicht. Man wusste auch ungefähr, wie weit man in seiner Vermeidungshaltung gehen konnte, ohne ein Schuljahr zu riskieren. Noten haben uns nicht davon abgehalten, einander zu helfen – eher im Gegenteil. Und es war uns allen klar, dass wir ohne den Notendruck wahrscheinlich in gut der Hälfte der Fächer freiwillig keinen Finger gerührt hätten. Ich kann mich auch nicht erinnern, jemals den Eindruck gehabt zu haben, dass ich besonders unfair bewertet worden wäre. Aber meine Leistungen waren meist okay bis gut, insofern bin ich kein klassisches „Notenopfer“.

    Also, solange die Politik festlegt, dass bestimmte Dinge verbindlich gekonnt werden sollen, und das Ganze in einer Leistungsschau mit Reihung namens Abitur endet, halte ich es für grob fahrlässig, in den Jahren davor auf Noten zu verzichten. Noten zeigen einem, ob man momentan eine Chance hat, das Endziel zu erreichen, und Noten bringen einen vielleicht in den vermaleiteren Schuljahren dazu, doch ab und zu ein Buch in die Hand zu nehmen.

  24. @gruenblinder

    aber erst ab klasse 8? (weiteres sieh links)

    @Susann

    Ausnahmen bestätigen die Regeln, wird gerne bei dieser persönlichen Sichtweise behauptet.
    Noten machen wen krank?: Die Lehrer, falls wir der Statistik glauben.
    Egozentrisch? Nein? Wirklich nicht? Wenn ich unsere Schule hier ansehe, dann sehe ich vor allem Einzelkämpfer. Jeder kämpft für sich allein, jeder erfindet (fast) täglich das Rad neu. Jeder hält sein Fach für das wichtigste der Welt. Fächerübergreifenden Unterricht, gar noch in Projektform? Nicht bei uns.

    Hier ein paar weitere Links als Diskursfutter:

    Für die Notenvergabe kann selbst die Tagesform des Lehrers oder der Platz der Arbeit im Stapel einen Ausschlag geben: „Legt man einem Lehrer eine Arbeit ein zweites Mal vor, kommt er nicht selten zu einem anderen Urteil“, berichtet Hans Brügelmann. Zudem vergleichen Noten vor allem die Kinder einer Klasse miteinander, sagen aber nur wenig darüber aus, ob ein Schüler sich verbessert hat und wie sein individueller Leistungsstand ist – denn eine Drei in einer starken Lerngruppe hat logischerweise eine ganz andere Bedeutung als in einer schwachen.

    http://www.geo.de/GEO/heftreihen/geo_wissen/die-ideale-schule-schule-ohne-noten-funktioniert-das-62295.html?p=1

    http://www.sueddeutsche.de/muenchen/wolfratshausen/montessori-schule-lernen-ohne-notendruck-1.1657081

    http://www.focus.de/schule/schule/bildungspolitik/radikalreform-schule-ohne-noten-und-sitzenbleiben_aid_385782.html

    Fast alle beklagen sich heftig über Notendruck, nervige Lehrer, frühes Aufstehen, unbeliebte Fächer und den Raub kostbarer Lebens- und Freizeit

    Bündelt man die Tausenden von Antworten, so ergibt sich eine klare Liste, angeführt von der Angst zu versagen, schlechte Noten zu bekommen, sitzen zu bleiben und den Schulabschluss nicht zu schaffen.

    Für etwa 90 Prozent von ihnen ist es wichtig, in der Schule erfolgreich zu sein, gut mitzukommen und gute Zensuren zu erreichen.

    Zum Schlimmsten an Schule gehören aus Sicht der Jugendlichen auch die Lehrer. Die Jugendlichen beklagen autoritäres und extrem dirigistisches Lehrerverhalten, Tadel und Spott, Herabsetzung und Demütigung von Schülern. Von Klasse 7 bis 9 hat sich das Lehrerbild der Heranwachsenden deutlich verschlechtert: Nur noch rund fünf Prozent aller Schüler/innen (gegenüber rund 25 Prozent in Klasse 7) geben an, von allen Lehrern gerecht behandelt zu werden, und nur noch 15 Prozent in Klasse 8 und zehn Prozent in Klasse 9 erleben ihre Lehrkräfte als verständnisvoll.

    Viele schlecht benotete Jugendliche sehen sich als Opfer der Laune oder Willkür der Lehrer und empfinden Noten als Disziplinierungsmittel.

    Dieses Ergebnis ist deshalb von Bedeutung, weil vom erlebten Lehrerengagement ein signifikanter Einfluss auf die Entwicklung der Ich-Stärke und des Leistungsvertrauens der Jugendlichen ausgeht.

    http://www.tagesspiegel.de/wissen/neue-studie-was-ist-das-schlimmste-an-der-schule/6019988.html

  25. @gruenblinder
    Andere Formen, Leistung zu beurteilen, sind z. B. Verbalzeugnisse und Portfolios/direkte Leistungsvorlagen, im Kommen sind gerade „Bagdes“.

    Verbalzeugnisse gab es schon vor den Zensuren. Sie können frei formuliert sein oder aus Textbausteinen zusammengesetzt werden. Wichtig ist, dass ein Referenzrahmen mitgeliefert wird, um die beschriebene Leistung an einem „Soll“ messen zu können.
    Im schulischen Kontext liefern Kerncurricula und Bildungsstandards solch einen Rahmen.
    Vorteile z. B. :
    – Die fachliche Leistung kann differenziert beschrieben werden.
    – Schüler und Eltern sehen, in welchen Lernbereichen genau Defizite bestehen.
    – Es können auch Leistungen dargestellt werden, die das „Soll“ überschreiten.
    – Es gibt Raum, Fähigkeiten und besondere Stärken mit aufzuführen, die nicht in den üblichen Fächerkanon passen.
    Nachteile z. B. :
    – Es ist sehr zeitaufwendig, ein gutes Verbalzeugnis zu formulieren.
    – Lehrer müssen erst lernen, solche Zeugnisse zu schreiben: berichten statt beurteilen, beobachten statt interpretieren, nicht psychologisieren.

    Portfolios/direkte Leistungsvorlagen stellen erzielte Leistungen direkt dar.
    Statt einer Ziffernnote werden die Arbeitsergebnisse konkret vorgelegt, sodass sich der „Abnehmer“ ein eigenes Bild machen kann.
    Kunst- und Musikhochschulen z. B. verlassen sich schon lange nicht mehr auf die Zeugniszensuren.
    Vorteile z. B. :
    – Der Leser kann sich ein eigenes, genaues Bild von den Leistungen machen.
    – Erzielte Leistungen verschiedener Schüler/Schulen können detailliert verglichen werden, z. B. in Bewerbungsverfahren.
    – Außerschulische Leistungen können mit aufgenommen werden und erweitern das dargestellte Leistungsspektrum.
    – Die Darstellung der Leistung geht vom Schüler aus, der Lehrer berät und unterstützt.
    Nachteile z. B. :
    – Ein Portfolio zu studieren kostet Zeit. Ziffernzeugnisse lassen sich schneller lesen, schneller vergleichen und mathematisch auswerten.
    – Der „Abnehmer“ hat seinen eigenen Referenzrahmen, an dem er das Portfolio misst. Dieser Rahmen bleibt dem Schüler meist unbekannt.

    Badges sind reale oder virtuelle Auszeichnungen, die für das erfolgreiche Bestehen genau formulierter Anforderungen, die öffentlich einsehbar sind, von anerkannten Institutionen vergeben werden. Sie stellen quasi eine Sammlung erreichter Lernziele dar.

  26. @ Jo

    Nicht die Noten machen die Lehrer zu Einzelkämpfern, sondern einerseits Strukturen, die Zusammenarbeit kaum vorsehen (-> also kaum verpflichtende Zusammenarbeit, Zeit für gemeinsame Unterrichtsvorbereitung usw.), andererseits glaube ich, dass es die Unsicherheit von Lehrkräften ist, die eigene Arbeit zur Beurteilung durch Kollegen öffentlich zu machen. An meiner Schule wird Materialtausch nur im kleinen, vertrauten Rahmen betrieben – also zwischen Leuten, die sich mögen, lange kennen, oder explizit um Material bitten -, aber nicht institutionalisiert. Ich glaube nicht, dass das mit der Notengebung zu tun hat.

    Teile Ihrer Schulkritik, finde ich, haben mit der Frage der Notengebung nicht allzu viel zu tun. 8 Jahre seines Lebens ein Fach zu haben, das einen nicht interessiert, nervt doch unabhängig von der Notengebung! Das hält man für verschwendete Lebenszeit, egal, ob man dann noch für einen Test lernen muss oder nicht!

    Ein Lehrer kann Schüler respektvoll behandeln, ob er ihnen nun Noten geben muss oder nicht. Das hat für mich mit der Einstellung, dem Berufsethos des Lehrers und seiner Persönlichkeit zu tun, nicht mit der Notengebung. Der Zusammenhang zwischen „vergibt schlechte Noten“ und „Verspottet Schüler im Unterricht erschließt sich mir nicht.

    Aus meinen Pubertätsklassen höre ich bei schlechten Noten öfter mal „Ja, ich hätte halt früher mit lernen anfangen sollen…“ oder „Naja, es hat mich nicht so gefreut, zu lernen…“. Also ich glaube nicht, dass da die schlechten Noten alle Ausdruck von Lehrerwillkür wären oder so empfunden werden. Aber das kann ich empirisch so schlecht nachweisen wie Sie.

    Was natürlich stimmt, ist, dass Noten oft innerhalb nur der Klasse einen Vergleich schaffen (oder auch nicht, wenn ich 2 Klassen parallel führe, korrigiere ich jedesmal etwas 60 gleiche Arbeiten). Das liegt auch an der Idiotie vieler Schulen, bei der Notengebung eine Gaußsche Normalverteilungskurve mit einen Schnitt um die 3 zu verlangen – d. h., für jede 1 brauche ich im Prinzip eine 5, um sie im Sinne der Notenverteilung „auszugleichen“. Aber selbst das betrifft nicht den Sinn der Notengebung an sich, sondern die Art, wie Noten hierzulande gemacht werden (sollen).

    Ich halte es schlichtnicht für sinnvoll, Kritik an der Notengebung und Kritik am Schulsystem zu vermischen.

  27. (Verspätete Zwischenmeldung.)

    Viele der genannten Nachteile von Noten sehe ich auch. Ja, das ist so. Von den Vorteilen der Alternativen bin ich nicht überzeugt, aber wenn das mal ein anderes Bundesland erfolgreich vormachen könnte: gerne. Bis dahin halte ich es mit dem, was Jan oben schrieb: „Notengebung [ist] schlecht – aber […] die am wenigsten schlechte Möglichkeit, um den verschiedenen Funktionen gerecht zu werden.“
    Ich finde die Nachteile der Noten auch überdramatsiert.

    Jo, also bleiben von deiner ganzen Zusammenfassung nur diese zwei Zeilen, und danach noch die Stelle, wo es heißt, dass die schlechten Leistungen möglicherweise auf schlechtes Selbstbild zurückzuführen sind? (Und, wie man dann annehmen kann, dass dieses schlechte Selbstbild von schlechten Noten kommt oder durch sie verstärkt wird?) Das ist schon gewichtig, das stimmt, da gebe ich dir recht. Aber dann hat all der Rest deines Textauszugs, insbesondere das mit Deutsch, das ich in meiner allerersten Antwort gleich angesprochen habe, nichts mit den Noten zu tun, sondern mit der abfallenden Leistung in der Mittelstufe, habe ich das richtig verstanden? Mir geht bei Copy & Paste leider der Zusammenhang verloren, denn ich dann selbst wiederherstellen muss.

    Ich sehe es ansonsten ähnlich wie Susann.

  28. Mir scheint, es sind die Kritiker der Noten, die mit ihrer – manchmal fast hysterischen – Kritik am Vergabesystem die Noten zu genau dem Fetisch machen, der dann die Kritik hervorruft.

    Portfolios und Badges sind ein prima Notenersatz, aber dann leidet aber bestimmt wieder jemand unter Fahrtenschwimmersyndrom oder dergleichen. Als Gutachter auf allen möglichen Ebenen der Beurteilung kann ich auch die Wortgutachten nicht als echte Alternative betrachten. Worin besteht der Unterschied, wenn ich feststelle X kann „das“ und „dass“ nicht unterscheiden und Note 6 in einem Grammatiktest?

    Außerdem: Dass noch immer der Einzelkämpfer das Paradigma im Lehrerberuf sein soll kann ich zwar nachvollziehen, aber es gibt bereits viele Schulen, an denen Alternativen versucht werden. Bei uns scheitern diese Ansätze im Detail häufig an den unterschiedlichen zeitlichen Spielräumen. Ich fürchte wir müssen mit diesen Unzulänglichkeiten leben. Ich kann mir auch ein Lehrer- und Schülerparadies vorstellen, in dem alle glücklich sind. So, und jetzt zurück zu dem „Plötzlich…“-Mist, den meine Fünftklässler zusammengeschrieben haben (Übungsaufsatz). Wer bringt denen diesen Quatsch bei?

  29. @susann

    Natürlich machen nicht die Noten ansich den Lehrer zum Einzelkämpfer und ebenso machen sie ihn nicht krank, in direkter Konsequenz. Da Noten bei uns eine so enorme Wichtigkeit bekommen haben und unsere Noten ausschliesslich individuelle Leistungen in einem Wettbewerbssystem messen wollen, kommt es natürlich zu einer von dieser Struktur erzeugten „negativen“ Stimmung, die kaum dazu geeignet ist, gemeinschaftlich zu handeln und auf die lange Strecke unserer Verweildauer in dieser Struktur soviel „negative“ Energien freisetzt, dass nur unter 25 % der pensionierten verbeamteten Lehrkräfte die Regelaltersgrenze von 65 Jahren erreichten. Weibliche Lehrkräfte sogar knapp unter 15 %. (Ich müsste googeln in welchem Bundesland das war und ob das bundesweit so ist.)

    Habe diese Diskussion gefunden, die ebenfalls das Thema diskutiert:

    http://shiftingschool.wordpress.com/2013/08/23/schule-lehrer-und-schuler-am-limit/#comments

    „… andererseits glaube ich, dass es die Unsicherheit von Lehrkräften ist, die eigene Arbeit zur Beurteilung durch Kollegen öffentlich zu machen. An meiner Schule wird Materialtausch nur im kleinen, vertrauten Rahmen betrieben – also zwischen Leuten, die sich mögen, lange kennen, oder explizit um Material bitten -, aber nicht institutionalisiert. “
    Ist es nicht seltsam, dass in einem Umfeld, das Beurteilungen in den Mittelpunkt stellt, die Beurteilenden ein solches Problem mit der eigenen Beurteilung haben und eine Zusammenarbeit erst eine extremes Vertrauen erfordert und eine ausdrückliche Bitte um Material?

    „Strukturen, die Zusammenarbeit kaum vorsehen (-> also kaum verpflichtende Zusammenarbeit, Zeit für gemeinsame Unterrichtsvorbereitung usw.)“
    Das stimmt so nicht, nicht aktuell in Bayern. Wollte man, könnte man.

    Fächerverknüpfende und fächerübergreifende Unterrichtsvorhaben Jahrgangsstufe 8:
    „Die folgende Auflistung enthält Vorschläge für fächerverknüpfende und fächerübergreifende Unterrichtsvorhaben. Jeder Schüler soll in seiner Klasse an mindestens einem Unterrichtsvorhaben im Lauf des Schuljahrs teilnehmen.
    In ihrer gemeinsamen Verantwortung entscheiden die Lehrkräfte einer Klasse, welche Unterrichtsvorhaben durchgeführt und wie sie realisiert werden. Bei den Planungen und der Organisation werden die Schüler in altersgerechter Weise mit einbezogen.
    Die Themen beziehen sich im Sinn vernetzten Lernens schwerpunktmäßig auf Ziele und Inhalte mehrerer Fächer, tragen zur Vertiefung von Methodenkompetenz und zur Umsetzung allgemeiner gymnasialer Bildungs- und Erziehungsziele bei. …“

    Es gibt Schulen, die Monatsprojekte machen.

    Bei uns sieht das so aus, dass es 2! (in Worten: zwei) Projekttage gibt. Eine Abstimmung zwischen Deutsch und Latein über eine parallele Behandlung der gleichen grammatikalischen Sachverhalte ist seit Jahren nicht möglich. Ach wenn ich jetzt anfange, dann …

  30. @frandevol:

    Danke, für mich der hauptsächlich mit Modellen arbeitet, würde das alles unter die Kategorie Noten fallen.

    Mich würde mal interessieren, ob es den Leuten wirklich so viel besser geht und ob das im Leben alles so viel gerechter zu geht, nur weil man an der Metrik, wie man Leistung misst ein bisschen rumschraubt. Ich sehe all die schlimmen Dinge die Noten irgendwie anrichten KÖNNEN ja auch, aber irgendwie werde ich das Gefühl nicht los, dass man immer dann, wenn man versucht vergleichbarkeit zu schaffen Ungerechtigkeit induziert.

    @Jo: Richtig, Noten gibt es in Schweden erst später als in Deutschland. Allerdings stellt sich die Frage wer Mittelstufennoten in Deutschland so ernst nimmt, dass er davon diese furchtbaren Traumata davon trägt von denen alle redne. Sollte das so sein, ist da noch viel anderes schief gelaufen. Im Übrigen halte ich es auch für eine Mär, dass das ohne Noten bis Klasse 8 alles viel toller ist. Dann wird halt über ein Einzelgespräch klar gemacht, dass das Kind enormen Nachholbedarf hat und es wird auch in Förderklassen gesteckt (oder muss sonderkurse belegen). Das mag alles netter „geframed“ sein, aber so blöd sind die Leute nun auch wieder nicht, dass sie nicht kapieren, dass das ein und das selbe ist.

  31. Wenigstens bei dem Einzelkämpfertum und der negativen Stimmung scheinen wir uns einig zu sein, @Jo. Ob das an dem postulierten Wettbewerbssystem liegt… Ich sehe als Ursache etwas anderes: Der Mittelpunkt der beruflichen Arbeit ist zu Hause ist und nicht in der Schule. Das ist steuerrechtlich so und auch tatsächlich. Ich unterrichte in der Schule, aber das ist ja oft ein Vergnügen. Zu Hause mache ich das Mühsame, Korrigieren und Vorbereiten und Planen. Deshalb wird Zeit, die man in der Schule verbringt, nur so weit wie nötig zugestanden – weil man eigentlich zu Hause sein und arbeiten müsste. (Oder mit der Familie verbringen will, weil man die Arbeitszeit ja eigens auf die Zeit nach acht Uhr abends gelegt hat.) Deswegen sehe ich oft eine Schulflucht von Kollegen.

    Wenn es Büros in den Schulen gäbe, wäre das anders. Man trifft sich und berät Sachen. Man geht gemeinsam Mittagessen, macht gemeinsam Kaffeepause. Man nutzt automatisch die gemeinsamen Ressourcen, weil die nun mal im gemeinsamen (Fachbereichs-)Böro stehen. Und dann tauscht man vielleicht auch selbst hergestellte Ressourcen, einigt sich vielleicht auf einen Ordner mit Best-Practice-Material.

    Würde unseren Berufsstand professionalisieren. Finanziert werden wird das nicht.

  32. @Jo

    Bei der negativen Stimmung, da gehen wir völlig d’accord. Ich glaube aber – nach den Rückmeldungen meiner Kolleg/innen zu urteilen – nicht, dass die Benotung der belastendste Faktor ist. Sie wird nicht als solcher genannt. Genannt werden viele (teils widersprüchliche, teils als sinnlos empfundene) Vorgaben „von oben“, zu volle Lehrpläne, ein Schulgebäude mit Fenstern, die man nicht öffnen kann, Zeitdruck, Korrekturen bei drei Deutschklassen. Benotung wird eigentlich nicht genannt. Kann natürlich sein, dass das das Megatabuthema ist und innen drinnen alle darunter leiden, aber für mich ist die Notengebung das Lästigste, aber nicht das Belastendste an meinem Job. Geht anderen wahrscheinlich auch so.
    Ich stimme Herrn Rau zu, der die ganze Arbeit-zuhause-bis-in-die-Puppen-Kultur kritisiert.
    Ein ordentlicher Arbeitsplatz (mit zu öffnendem Fenster, ceterum censeo…), und ich ziehe mit Sack und Pack in die Schule um!

    „Ist es nicht seltsam, dass in einem Umfeld, das Beurteilungen in den Mittelpunkt stellt, die Beurteilenden ein solches Problem mit der eigenen Beurteilung haben und eine Zusammenarbeit erst eine extremes Vertrauen erfordert und eine ausdrückliche Bitte um Material?“
    ABSOLUT, ABSOLUT, LOHNT SICH im Kollegenkreis, darüber nachzudenken…und dann vielleicht bei der nächsten Testrückgabe die schlechte Note von Maxi Müller sensibel und mit tröstenden Worten an den Mann zu bringen.

    “Strukturen, die Zusammenarbeit kaum vorsehen (-> also kaum verpflichtende Zusammenarbeit, Zeit für gemeinsame Unterrichtsvorbereitung usw.)”
    Das stimmt so nicht, nicht aktuell in Bayern. Wollte man, könnte man.
    => Sehe ich nicht so, ebenfalls in Bayern. Steckt alles SEHR in den Kinderschuhen. Dies von einer, die seit Jahren versucht, einen Materialtausch zu institutionalisieren.
    Das fächerübergreifende Projekt führen wir tatsächlich durch (3 Projekttage. Muhaha.), aber das ist für mich ein Sonderzuckerl und keine alltägliche Zusammenarbeit – und selbst die wird immer nur von einer Handvoll Tapferer getragen, der Rest klinkt sich mehr oder weniger unauffällig aus (-> s. Einzelkämpfertum).

    Darf ich, damit das Ganze nicht in so eine stimmungstötende Schwarzmalerei ausartet, sagen, dass ich echt gerne unterrichte? Geht Euch wahrscheinlich auch so. :-)

  33. @alle
    Danke für eure Geduld mit mir. Und für die doch sehr reflektierenden Antworten.

    @susann

    Zum Verständnis meiner Vermutung zum Kranksein und zur schlechten Stimmung, möchte ich einen aktuellen Beitrag im neuen Artikel von Thomas zitieren
    https://www.herr-rau.de/wordpress/2013/10/also-gut-also-gut-ich-bin-mit-noten-auch-nicht-zufrieden.htm#postcomment

    Thomas Kuban:“Ich finde die Fülle an Noten ziemlich heftig. Hab es mal auf meinem Blog hochgerechnet. Kam auf 1700 – 1900 Einzelnoten pro Schuljahr bei einem Normaldeputat. Irre. Und ich habe festgestellt, dass mir, je länger ich dabei bin, desto schwerer fällt, Noten zu geben und zufrieden dabei zu sein. “

    Und diese mit der Frage von gruenblinder: „Allerdings stellt sich die Frage wer Mittelstufennoten in Deutschland so ernst nimmt, …“, zusammen führen.

    Meine Vermutung ist nun diese: Da wir so viel Noten vergeben, die dann verstärkt in der Mittelstufe zum Wiederholen führen, lässt es sich bei dieser Masse von durchschnittlich 1800 Werten, kaum vermeiden, auch mal umstrittene Noten zu vergeben. Zusammen mit den Kollegen, die wir für etwas kontraproduktiv im System halten, schaukelt sich diese Masse dann zu einer kritischen auf und ergibt am Ende diese aktuelle ungute Stimmung zwischen Schülern, Eltern, Kolleginnen und Kollegen. Diese negative Stimmung könnte u.a. diese vielen Fehlzeiten und Frühpensionen nach sich zieht.

    In den unteren und später wieder in den oberen Klassen ist die Stimmung meist ok. Die Mittelstufe scheint mir das grosse Problem. Falls wir hier ein anderes Unterichts- und Bewertungsmodell etablieren könnten, wäre vielleicht schon viel gewonnen.
    Ich sehe hier ein grosses Potential, das noch gehoben werden könnte. Es gibt grossartige Klassen und wunderbare Kolleg_inn_en. Oft gibt es mehr Möglichkeiten als wir zuerst denken.

    Und ja, nicht alles nur negativ sehen, sondern die positiven Punkte verstärken!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.