Lesbarkeitsindizes

Synchronizität: Lese gerade im BildungsBlog von www.seittest.de. Dort kann man automatisiert Webseiten bewerten lassen. Für www.herr-rau.de/wordpress sieht die Zusammenfassung dann so aus:

Inhaltliche Prüfung (50%): gut (Die Inhalte sind sachlich und von guter Qualität.)
SPAM-Prüfung (25%): sehr gut (Kaum Werbung und keine Belästigung durch SPAM.)
Autorität (25%): ungenügend (Die Seite wird von nur sehr wenigen vorbildlichen Webpseiten [sic] empfohlen.)

Nu, wie sinnvoll das ist, darüber mache ich mir nicht viele Gedanken. Immerhin: Inhalte von guter Qualität. Interessanter sind die Details der Auswertung:

Sprach-Niveau: sehr hoch
Rechtschreibfehler: 0 (0%)

Für die wenigen Rechtschreibfehler kriege ich immerhin 3 von 3 Punkten. Am interessanten ist für mich aber der Lesbarkeitsindex der Seite:

Lesbarkeit (FRE): 87

Bei Wikipedia kann man sich über Lesbarkeitsindizes informieren. (Ist das der korrekte Plural?) Auch der BildungsBlog-Eintrag oben schreibt etwas dazu. FRE steht für Flesch Reading Ease, ein „numerischer Wert für die Lesbarkeit, der aus einem Text berechnet werden kann. Je höher ihr Wert ist, desto leichter verständlich ist der Text. Gut verständliche Texte weisen einen Wert von etwa 60 bis 70 auf.“ Da liege ich mit meinen 87 ja recht gut.

Allerdings ist die Formel für FREdeutsch eine andere, und ich weiß auch nicht, ob von www.seittest.de das Menü oder die Tag-Wolke mitgezählt werden. Und wie zuverlässig der FRE-Wert ist, weiß ich ebenfalls nicht. Alternativ gibt es auch noch die Wiener Sachtextformel, ebenfalls bei Wikipedia nachzulesen.

Ich habe in den letzten Tagen ein Arbeitsblatt für meine Schüler gemacht, ausgehend von folgendem keinesfalls untypischen Satz in einem Übungsaufsatz (es geht um Sophokles‘ König Ödipus):

Im Gegensatz dazu steht seine Frau Jokaste, die erst erfreut über die Meldung des Boten, dass Polybos, der Ziehvater von Ödipus, verstorben sei und somit die Angst ihres Mannes, den eigenen Vater zu töten, unbegründet ist, ist, dann jedoch durch die Schilderung des Boten über seine Bekanntschaft mit Ödipus bemerkt, dass sie durchaus eine weit engere Beziehung zu ihrem Mann haben könnte, als sie es zunächst vermutet hatte.

Das Arbeitsblatt kann man hier herunterladen, aus ideologischen Gründen als OpenDocument-Dokument (das heißt: Open Office). Sein Inhalt: Nach einem Überblick über durchschnittliche Satzlängen in verschiedenen Quellen sollen die Schüler die durchschnittliche Satzlänge ihres Übungsaufsatzes errechnen, sollen danach zwei Bandwurmsätze sortieren und schließlich mit der Wiener Sachtextformel den Lesbarkeitsindex für ihren Text ermitteln.
Ich weiß nicht mehr darüber, als bei Wikipedia steht; die Formel gibt in etwa aus, wieviele Schuljahre man haben muss, um den Text zu verstehen.

Sehr gerne würde ich eine Facharbeit dazu vergeben, den LK dazu habe ich auch. Aber Schüler scheuen im weitesten Sinn sprachwissenschaftliche Themen, fürchte ich, vielleicht kann ich es aber doch schmackhaft machen. Das biete sich doch an: Ein kurzer Überblick über konkurrierende Indizes, über deren theoretische Begründung, und ein praktischer Teil mit Anwendung auf einen sehr kleinen Korpus einer zu wählenden Textsorte (gerne Obertstufenaufsätze). Am Schluss Bewertung der Resultate anhand eigener Einschätzung oder vielleicht auch einer Befragung.

Nachtrag: Antikörperchen, Autor des BildungsBlog-Beitrags, führt eine tolle Gedicht- und Interpretationssammlung (hier schon irgendwann mal verlinkt, glaube ich) mit Kommentaren, Bewertung und Lesbarkeitsindex dazu: http://lyrik.antikoerperchen.de/uebersicht.html. Sehr spannend.

Tagged: Tags

19 Thoughts to “Lesbarkeitsindizes

  1. Ohje, hab das auch mal kurz gemacht. SPAM-Prüfung: SEHR GUT! :D

    Aber irgendwas kann da nicht stimmen: Sprach-Niveau sehr hoch 6/6
    ??? Kann ich mir bei meinem Geschreibe irgendwie nicht vorstellen ;)

  2. Index, indicis, m, lat. der Zeigefinger. Plural wie üblich in der konsonantischen Deklination, „indices“.

    Wünsche abendlich geholfen zu haben,

    Nele :)

  3. Ich schreib offensichtlich Kauderwelsch oder mindestens ziemlich mieses Deutsch, denn „Die Struktur, Inhalt oder Sprache der gewählten Seite erlaubt keine deutsche Inhaltsanalyse“

  4. Nachtgedanken, bei mir hat’s geklappt mit deiner Seite. Du hast tatsächlich

    – tatatatataaaaaa!!!-

    die Gesamtnote 2.0: Gut! Vor allem gilt: „Die Inhalte sind von sehr guter Qualität. Die Seite bemüht sich um ausdrucksstarke und umfassende Darstellung.“ (FRE von 74.)

  5. Danke für den tip, das ist lustig! Wegen fehlender Autorität komme ich auch nur auf „befriedigend“. Eine Uni müsste unsere Blogs empfehlen. Naja, das dauert noch …
    Und: der monetäre Wert ist ebenfalls 0. Nämlich 0 Euro, wenn man die Domaine verkaufen wollte. Ich finde zwar auch, dass mein Sprachniveau sehr hoch ist, aber woran will die Maschine das erkennen, außer an langen Sätzen mit vielen verschiedenen Wörtern und einem Haufen Satzzeichen? Also ohne Sinn. Oder es ist schon Web 3.0. Und noch unerfindlicher ist, wie die Computerprüfung die sachliche Richtigkeit erkennen will – ich habe bei der inhaltlichen Prüfung 17 von 20 Punkten (=gut). Aber was ist falsch??? Wahrscheinlich kann mir teacher darüber Auskunft geben ;-))

  6. Für Lesbarkeit gibt es hunderte Measures, die alle ihre Vor- und Nachteile haben, viele davon sind einigermaßen unbegründet. Die meisten Formeln machen lustige Annahmen, so wird z.B. bei Flesch die Silbenzahl abgeschätzt, mit dem Argument, längere (mehrsilbige) Wörter wären in der Sprache seltener (und damit schwieriger). Nun, Zipf hat das mal so behauptet, dass tendenziell die häufigen Wörter immer kurz sind , aber stimmen tut es eben nicht wirklich. Weswegen andere direkt auf Vokabular prüfen, wobei Vokabular oft natürlich sehr Genre-spezifisch ist (z.B. Fantasy vs. Krimi).
    Mit Readability allgemein beschäftigt sich DuBay: http://www.impact-information.com/impactinfo/readability02.pdf
    Eine Vollständigkeit anstrebende Liste von Formeln oder Verfahren ist mir nicht bekannt, ich hätte aber gerne eine. Das Coh-Metrix-System geht in diese Richtung: http://cohmetrix.memphis.edu/cohmetrixpr/index.html
    Mein Gefühl sagt mir: In den nächsten Monaten sollte ich mehr darüber herausgefunden haben. ;-)
    Diese Measures einfach so direkt und unreflektiert zu verwenden, ist jedenfalls… naja bestenfalls unseriös.

  7. Ich will den Machern der Seite noch gar keine fehlende Seriösität unterstellen, ich habe mir nicht mal angeschaut, ob die irgendwas zum Bewertungsalgorithmus oder -heurismus schreiben. Noch kann da ohnehin nicht viel herauskommen, aber den Ansatz finde ich interessant. (Bis ich mal weniger Deutschaufsätze korrigieren muss, da vergeht aber noch Zeit.)

    Vielen Dank für die Readability-Links. Die haben leider den Wunsch geweckt, mich noch mehr damit zu beschäftigen. Ich würde mich freuen, in den nächsten Monaten etwas darüber zu lesen.

  8. Hallo, verfolge gespannt die Diskussion über http://www.SeitTest.de. Als Erfinder von http://www.SeiTest.de hat mich immer geärgert, dass Webseiten von Google et al. vor allem anhand der Verlinkung bewertet werden. Egal wie gut der Inhalt ist, ohne Backlinks erscheint eine Webseite nicht oben in den Suchmaschinen. Darum berechnet http://www.SeitTest.de den Flesch Reading Ease Index für Deutsch. Allerdings mit einer gewissen Unschärfe, da es schwer ist, auf Webseiten, den wirklichen Text (ohne Tags, Links etc) zu identifizieren. Das ganze Projekt ist erst ein paar Tage alt und daher noch schlecht dokumentiert. Das alles folgt noch – denn die Resonanz ist bisher sehr positiv. Feedback und Kritik zu SeitTest.de gerne auch per E-Mail direkt an micht: webmaster@seittest.de. Cheers, Lars

  9. @Lars, @herr-rau: Wo findet der denn die Banner? Die Seite ist doch voellig Werbefrei, oder? Weil 25% is ja doch ne Menge und kaum ist nicht nix.

  10. Ha! Endlich mal besser als ein Lehrer :P

    Inhaltliche Prüfung (50%) sehr gut Die Inhalte sind von sehr guter Qualität. Die Seite bemüht sich um ausdrucksstarke und umfassende Darstellung.
    SPAM-Prüfung (25%) sehr gut Kaum Werbung und keine Belästigung durch SPAM.
    Autorität (25%) ungenügend Die Seite wird von nur sehr wenigen vorbildlichen Webpseiten empfohlen.
    Gesamturteil gut (2.0)

  11. Lars hat anscheinend viel rumgebastelt, es gibt neu die Kategorie Usability, ich komme insgesamt auf 1.8 – das muss ja ein Fortschritt sein.:-)

    Gutes Schülerblog aus unserer Schule: Kommt auch auf 1.8

    Das ISB kommt inhaltlich nur auf gut, Autorität ist aber ausreichend, Note 2.1

    Örtliches Lokalforum mit viel Schülerkommentaren: Muss ein Bug sein, meldet ständig: Server überlastet.

    Typische Schüler-Webseite getestet (bloggende Schüler sind nicht typisch): Da ist so wenig zusammenhängender Text drin, dass eine Untersuchung nicht möglich ist.

  12. es muss sowas wie eine blacklist geben? … Jedenfalls kann ich egal welche Seite eingeben – sie wird getestet. Nur meine ums Verrecken nicht. Da erscheint immer „server ist ausgelastet“.

  13. @Lisa Rosa, das war auch meine Standardantwort fürs Schülerforum. Deine Seite hat bei mir aber geklappt:

    Inhaltliche Prüfung (50%) gut
    SPAM-Prüfung (20%) sehr gut
    Autorität (20%) ausreichend
    Usability (10%) sehr gut
    Gesamturteil gut (2.1)

    Respekt, ausreichende Autorität.

    Dafür erkennt das System bei mir jetzt gar nichts mehr. Ist halt noch work in progress.

  14. Ich finde es erstaunlich, dass im Impressum von Seittest darauf hingewiesen wird, dass weder Grafiken oder Texte in fremden Websites verfügbar gemacht werden dürfen, Seittest selbst aber einen Code anbietet, um ein Logo mit dem Textergebnis auf der eigenen Website einzubinden. (http://www.seittest.de/impressum.html)

    Aber wie Lars selbst sagt, ist die Website erst ein paar Tage alt. Da werden diese Hinweise vielleicht noch angepasst. Bis dahin werde ich natürlich keine Textauszüge, die meine eigene Website betreffen auf meiner Website veröffentlichen.

  15. Vielen Dank. Hatte ich noch gar nicht abonniert, dabei ist das doch alles interessant. Ein weiterer Einsatz, den ich mir davon erhoffe: Schülern zeigen, dass ihre Sätze zu lang sind. Aber so einfach ist das vermutlich auch wieder nicht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.