Nathan in XML

Ich vertrat mal eine Klasse, die eigentlich Nathan der Weise lesen sollte, in der die Lehrkraft aber erkrankt und die Lektüre noch nicht da war. Langsam eilte es ein wenig, fand ich, deshalb gab ich den Schüler erst einmal eine digitalisierte Nathan-Version für die Lektüre zu Hause und für den Computerraum, in dem ich meine Vertretungsstunden halte, wann immer das möglich ist.

So einfach ist das aber nicht mit der digitalen Fassung. Denn die Datei sollte ausdruck- und veränderbar sein und eine korrekte Verszählung aufweisen – Nathan besteht in der verwendeten Fassung aus 3849 Versen. Wie kriegt man das mit der Verszählung hin?
Wenn man sich mit der automatischen Zeilennummerierung von solchen Programmen nicht auskennt, benutzt man dazu gerne mal Tabellen: zweispaltig, mit einer breiten Spalte rechts für den Text und eine schmale Spalte links für die händisch einzutragenden Zeilennummern. Das ist aber aufwendig und ungeschickt. Denn wenn ich rechts am Text etwas ändere oder die Spaltenbreite verändere, dann verschieben sich die Zeilennummern nicht mit, was für Prosatexte noch angehen mag, bei Verstexten aber Probleme macht.

Wer es sich einfacher machen will, benutzt dazu die automatische Zeilennummerierung; Leerzeilen, wenn man sie überhaupt verwendet, sollen dabei nie mitgezählt werden, alle 5 Zeilen steht am Seitenrand die laufende Zeilennummer, und gut ist.

So sieht in der Textdatei, die der Ausgangspunkt meiner Arbeit war, der Anfang von Nathan aus:

Erster Aufzug

Erster Auftritt

(Szene: Flur in Nathans Hause.)

Nathan von der Reise kommend. Daja ihm entgegen.

Daja.
Er ist es! Nathan! – Gott sei ewig Dank,
Dass Ihr doch endlich einmal wiederkommt.

Nathan.
Ja, Daja; Gott sei Dank! Doch warum endlich?
Hab ich denn eher wiederkommen wollen?
Und wiederkommen können? Babylon
Ist von Jerusalem, wie ich den Weg,
Seitab bald rechts, bald links, zu nehmen bin
Genötigt worden, gut zweihundert Meilen;
Und Schulden einkassieren, ist gewiss
Auch kein Geschäft, das merklich födert, das
So von der Hand sich schlagen lässt

Daja. O Nathan,
Wie elend, elend hättet Ihr indes
Hier werden können! Euer Haus…

Nathan. Das brannte.
So hab ich schon vernommen. – Gebe Gott,
Dass ich nur alles schon vernommen habe!

Mit Suchen/Ersetzen habe ich die vorhandenen Leerzeilen entfernt, die Überschriften habe ich mit einer Formatvorlage “Überschrift 2” beziehungsweise “Überschrift 3” versehen, ebenso den Absätzen, die nur aus Regieanweisungen bestehen, eine neuen Formatvorlage “Regieanweisung” zugewiesen. Alle diese drei Formatvorlagen erhalten als Merkmal, das Zeilennummern bei ihnen nicht mitgezählt werden. Außerdem wurde jedes “Nathan.” am Anfang eines Absatzes kursiv gesetzt, ebenso die anderen Namen; diesen Zeilen, wenn sie außer dem Namen nichts enthielten, wurde ebenfalls mit Suchen/Ersetzen das Format “Regieanweisungen” zugewiesen. Dann sieht das ungefähr so aus:

Erster Aufzug
Erster Auftritt
(Szene: Flur in Nathans Hause.)
Nathan von der Reise kommend. Daja ihm entgegen.
Daja.
Er ist es! Nathan! – Gott sei ewig Dank,
Dass Ihr doch endlich einmal wiederkommt.
Nathan.
Ja, Daja; Gott sei Dank! Doch warum endlich?
Hab ich denn eher wiederkommen wollen?

Das geschieht einigermaßen zuverlässig und automatisiert. Als Zeilen werden dabei nur die regulären, weder fetten noch kursiven, gezählt. Der Vorteil von Formatvorlagen: Ich kann alle auf einmal ändern. Wenn ich zum Beispiel möchte, dass Regieanweisungen fett statt kursiv erscheinen, muss ich nur die Vorlage ändern, und das wirkt sich dann auf alle entsprechenden Absätze aus.

Leider reicht das immer noch nicht. Es gibt nämlich das Stilmittel der Antilabe: dabei teilen sich zwei oder mehr Sprecher einen Vers, jeder spricht also nur einen Teil. Deswegen stellen die folgenden Zeilen auch 7 Verse dar, und nicht etwa 9 (die hier fett gedruckten Zeilen bilden jeweils zusammen einen Vers):

Und Schulden einkassieren, ist gewiss
Auch kein Geschäft, das merklich födert, das
So von der Hand sich schlagen lässt
Daja. O Nathan,
Wie elend, elend hättet Ihr indes
Hier werden können! Euer Haus…
Nathan. Das brannte.
So hab ich schon vernommen. – Gebe Gott,
Dass ich nur alles schon vernommen habe!

Zusammen bestehen dann jeweils zwei fett gedruckte Zeilen aus fünf Jamben – einem Vers. Also kriegen diese Zeilen – in meiner Vorlage glücklicherweise daran erkennbar, dass dem Sprechernamen keine eigene Zeile gegeben wird – eine Formatvorlage “Halbzeile” zugewiesen, für die gilt, dass sie bei der Zeilenzählung ignoriert wird.

Das war umständlich und erforderte bei allem gewitzten Suchen/Ersetzen dann doch noch manuelle Eingriffe. Keine Lösung gibt es für den Fall, dass ein Vers länger ist als eine Zeile, so dass am Seitenrand umbrochen und eine zusätzliche Zeile gezählt wird. Und es reicht mir eigentlich noch nicht. Am liebsten hätte ich zum Beispiel auch noch die Möglichkeit, alle Äußerungen Nathans in einer, die der Daja in einer anderen Farbe darzustellen.

Dazu bräuchte ich den Text zum Beispiel in einem XML-Format. Das könnte dann so aussehen:

<dialog>
  <sprecher person=Daja>
   <vers>Er ist es! Nathan! – Gott sei ewig Dank,</vers>
   <vers>Dass Ihr doch endlich einmal wiederkommt.</vers>
  </sprecher>
  <sprecher person=Nathan>
   <vers>Ja, Daja; Gott sei Dank! Doch warum endlich?</vers>
   <vers>Hab ich denn eher wiederkommen wollen?</vers>
  </sprecher>
</dialog>

Alles, was ein <vers> ist, wird beim Nummerieren einmal gezählt, auch wenn der <vers> mal so lange ist, dass er beim Druck auf zwei Zeilen verteilt werden würde. Eine <regieanweisung> kann mitten in einem <vers> stehen oder auch nicht. Die Antilabe behandelt man so:

<sprecher person=Daja>
  <vers typ=Ende>O Nathan,</vers>
  <vers>Wie elend, elend hättet Ihr indes</vers>
  <vers typ=Anfang>Hier werden können! Euer Haus.../vers>
<sprecher>
<sprecher person=Nathan>
  <vers typ=Ende>Das brannte.</vers>
  <vers>So hab ich schon vernommen. – Gebe Gott,</vers>
  <vers>Dass ich nur alles schon vernommen habe!</vers>
</sprecher>

Verse werden dabei als Ganzvers oder als Halbvers (Typ: Anfang, Mitte, Ende) markiert. Damit enthält der annotierte Text alle wichtigen Informationen. Was ein Textverarbeitungs- oder auch ein ganz anderes Programm* damit anstellt, ist dessen Sache.

Für Shakespeare gibt es schon mehrere XML-Projekte, hier sind zum Beispiel alle Stücke in einem XML-Format zum Anschauen und Herunterladen. Eine ausgefeiltere Markierung wird bei der Text Encoding Initiative vorgestellt, eine übersichtlichere Zusammenfassung davon bei Wikipedia.

Ich spreche dauernd von “einem XML-Format”, weil XML der Überbegriff für derartige Formatierungen ist. RSS-Feeds, OpenOffice-Dateien, docx, svg-Grafiken, GoogleEarth-Routen sind alles Formen von XML. Das Format der Text Encoding Initiative ist wohl ein verbreiteter Standard für Texte. Auf der Liste von TEI-Projekten finde ich an deutscher Literatur eigentlich nur Der junge Goethe der LMU München – 2 CDs voller Material, nicht online. Außerdem ein Projekt Berliner Intellektuelle 1800–1830 der Humboldt-Universität, wo fürs erste Quartal 2012 ein Sandmann angekündigt ist. Und schließlich gibt es das Deutsche Textarchiv, wo bereits recht viele deutschsprachige Bücher in diesem Format erfasst sind – allerdings philologisch sehr sauber gemacht, mit den ursprünglichen Seiten- und Zeilenumbrüchen, also für das Lesen weniger geeignet. Man kann sich die Bücher als Scan anschauen oder als Text, die XML-Datei auch herunterladen, falls man mit ihr etwas anfangen wollte.

Wäre doch alles mal etwas für ein W‑Seminar Deutsch/Informatik?

*Es gibt zum Beispiel ein Programm, das die Beziehung von Personen in sozialen Netzwerken analysiert und grafisch darstellt. Das läuft nicht über XML, soweit ich weiß, aber eine XML-markierte Eingabe würde auch da die Weiterverarbeitung erleichtern. Hier wurde das Programm auf die Stücke Shakespeares angewendet, und man kann in Videos sehen, wie sich die Beziehungen zwischen den Figuren im Lauf des Stücks verändern.

Und falls jemand meine digitale Nathan-Fassung (.odt) braucht: hier ist sie, sicher noch nicht ganz fehlerfrei. Für den Alltag braucht man allerdings ohnehin nur kürzere Ausschnitte, die man sich schneller auf andere Weise zurechtformatieren kann.

2 Antworten auf „Nathan in XML

  1. Spannender als “alte” Texte mit Metadaten anzureichern fände ich, aktuelle Artikel z.B. der Wikipedia auf diese Daten zu untersuchen und nutzbar zu machen.

  2. Vielen Dank für die Nathan-Datei, kann ich gut gebrauchen für unsere Info-Sitzung zum Thema “Toleranz” (bei unserem Comenius-Projekt).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.