{"id":3625,"date":"2012-02-22T07:07:52","date_gmt":"2012-02-22T06:07:52","guid":{"rendered":"https:\/\/www.herr-rau.de\/wordpress\/?p=3625"},"modified":"2023-05-25T06:45:03","modified_gmt":"2023-05-25T04:45:03","slug":"nathan-in-xml","status":"publish","type":"post","link":"https:\/\/www.herr-rau.de\/wordpress\/2012\/02\/nathan-in-xml.htm","title":{"rendered":"Nathan in XML"},"content":{"rendered":"<div style='text-align:right;'><small>(<a href='https:\/\/www.herr-rau.de\/wordpress\/2012\/02\/nathan-in-xml.htm#comments'>2 Kommentare.<\/a>)<\/small> <\/div>\n<p>Ich vertrat mal eine Klasse, die eigentlich <em>Nathan der Weise<\/em> lesen sollte, in der die Lehrkraft aber erkrankt und die Lekt\u00fcre noch nicht da war. Langsam eilte es ein wenig, fand ich, deshalb gab ich den Sch\u00fcler erst einmal eine digitalisierte Nathan-Version f\u00fcr die Lekt\u00fcre zu Hause und f\u00fcr den Computerraum, in dem ich meine Vertretungsstunden halte, wann immer das m\u00f6glich ist.<\/p>\n\n\n\n<p>So einfach ist das aber nicht mit der digitalen Fassung. Denn die Datei sollte ausdruck- und ver\u00e4nderbar sein und eine korrekte Versz\u00e4hlung aufweisen &#8211; <em>Nathan<\/em> besteht in der verwendeten Fassung aus 3849 Versen. Wie kriegt man das mit der Versz\u00e4hlung hin?<br>Wenn man sich mit der automatischen Zeilennummerierung von solchen Programmen nicht auskennt, benutzt man dazu gerne mal Tabellen: zweispaltig, mit einer breiten Spalte rechts f\u00fcr den Text und eine schmale Spalte links f\u00fcr die h\u00e4ndisch einzutragenden Zeilennummern. Das ist aber aufwendig und ungeschickt. Denn wenn ich rechts am Text etwas \u00e4ndere oder die Spaltenbreite ver\u00e4ndere, dann verschieben sich die Zeilennummern nicht mit, was f\u00fcr Prosatexte noch angehen mag, bei Verstexten aber Probleme macht.<\/p>\n\n\n\n<p>Wer es sich einfacher machen will, benutzt dazu die automatische Zeilennummerierung; Leerzeilen, wenn man sie \u00fcberhaupt verwendet, sollen dabei nie mitgez\u00e4hlt werden, alle 5 Zeilen steht am Seitenrand die laufende Zeilennummer, und gut ist.<\/p>\n\n\n\n<p>So sieht in der Textdatei, die der Ausgangspunkt meiner Arbeit war, der Anfang von <em>Nathan<\/em> aus:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Erster Aufzug<\/p>\n\n\n\n<p>Erster Auftritt<\/p>\n\n\n\n<p>(Szene: Flur in Nathans Hause.)<\/p>\n\n\n\n<p>Nathan von der Reise kommend. Daja ihm entgegen.<\/p>\n\n\n\n<p>Daja.<br>Er ist es! Nathan! \u2013 Gott sei ewig Dank,<br>Dass Ihr doch endlich einmal wiederkommt.<\/p>\n\n\n\n<p>Nathan.<br>Ja, Daja; Gott sei Dank! Doch warum endlich?<br>Hab ich denn eher wiederkommen wollen?<br>Und wiederkommen k\u00f6nnen? Babylon<br>Ist von Jerusalem, wie ich den Weg,<br>Seitab bald rechts, bald links, zu nehmen bin<br>Gen\u00f6tigt worden, gut zweihundert Meilen;<br>Und Schulden einkassieren, ist gewiss<br>Auch kein Gesch\u00e4ft, das merklich f\u00f6dert, das<br>So von der Hand sich schlagen l\u00e4sst<\/p>\n\n\n\n<p>Daja. O Nathan,<br>Wie elend, elend h\u00e4ttet Ihr indes<br>Hier werden k\u00f6nnen! Euer Haus&#8230;<\/p>\n\n\n\n<p>Nathan. Das brannte.<br>So hab ich schon vernommen. \u2013 Gebe Gott,<br>Dass ich nur alles schon vernommen habe!<\/p>\n<\/blockquote>\n\n\n\n<p>Mit <strong>Suchen\/Ersetzen<\/strong> habe ich die vorhandenen Leerzeilen entfernt, die \u00dcberschriften habe ich mit einer Formatvorlage &#8222;\u00dcberschrift 2&#8220; beziehungsweise &#8222;\u00dcberschrift 3&#8220; versehen, ebenso den Abs\u00e4tzen, die nur aus Regieanweisungen bestehen, eine neuen Formatvorlage &#8222;Regieanweisung&#8220; zugewiesen. Alle diese drei Formatvorlagen erhalten als Merkmal, das Zeilennummern bei ihnen nicht mitgez\u00e4hlt werden. Au\u00dferdem wurde jedes &#8222;Nathan.&#8220; am Anfang eines Absatzes kursiv gesetzt, ebenso die anderen Namen; diesen Zeilen, wenn sie au\u00dfer dem Namen nichts enthielten, wurde ebenfalls mit Suchen\/Ersetzen das Format &#8222;Regieanweisungen&#8220; zugewiesen. Dann sieht das ungef\u00e4hr so aus:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<div style=\"font-weight: bold; font-size: larger;\">Erster Aufzug<\/div>\n\n\n\n<div style=\"font-weight: bold; padding-top: 5px;\">Erster Auftritt<\/div>\n\n\n\n<div style=\"font-style: italic; padding-top: 5px;\">(Szene: Flur in Nathans Hause.)<\/div>\n\n\n\n<div style=\"font-style: italic; padding-top: 5px;\">Nathan von der Reise kommend. Daja ihm entgegen.<\/div>\n\n\n\n<div style=\"padding-top: 5px;\"><em>Daja.<\/em><\/div>\n\n\n\n<div>Er ist es! Nathan! \u2013 Gott sei ewig Dank,<\/div>\n\n\n\n<div>Dass Ihr doch endlich einmal wiederkommt.<\/div>\n\n\n\n<div style=\"padding-top: 5px;\"><em>Nathan.<\/em><\/div>\n\n\n\n<div>Ja, Daja; Gott sei Dank! Doch warum endlich?<\/div>\n\n\n\n<div>Hab ich denn eher wiederkommen wollen?<\/div>\n<\/blockquote>\n\n\n\n<p>Das geschieht einigerma\u00dfen zuverl\u00e4ssig und automatisiert. Als Zeilen werden dabei nur die regul\u00e4ren, weder fetten noch kursiven, gez\u00e4hlt. Der Vorteil von Formatvorlagen: Ich kann alle auf einmal \u00e4ndern. Wenn ich zum Beispiel m\u00f6chte, dass Regieanweisungen fett statt kursiv erscheinen, muss ich nur die Vorlage \u00e4ndern, und das wirkt sich dann auf alle entsprechenden Abs\u00e4tze aus.<\/p>\n\n\n\n<p>Leider reicht das immer noch nicht. Es gibt n\u00e4mlich das Stilmittel der <strong>Antilabe<\/strong>: dabei teilen sich zwei oder mehr Sprecher einen Vers, jeder spricht also nur einen Teil. Deswegen stellen die folgenden Zeilen auch 7 Verse dar, und nicht etwa 9 (die hier fett gedruckten Zeilen bilden jeweils zusammen <em>einen<\/em> Vers):<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<div>Und Schulden einkassieren, ist gewiss<\/div>\n\n\n\n<div>Auch kein Gesch\u00e4ft, das merklich f\u00f6dert, das<\/div>\n\n\n\n<div><strong>So von der Hand sich schlagen l\u00e4sst<\/strong><\/div>\n\n\n\n<div style=\"padding-top: 5px;\"><em>Daja.<\/em> <strong>O Nathan,<\/strong><\/div>\n\n\n\n<div>Wie elend, elend h\u00e4ttet Ihr indes<\/div>\n\n\n\n<div><strong>Hier werden k\u00f6nnen! Euer Haus&#8230;<\/strong><\/div>\n\n\n\n<div style=\"padding-top: 5px;\"><em>Nathan.<\/em> <strong>Das brannte.<\/strong><\/div>\n\n\n\n<div>So hab ich schon vernommen. \u2013 Gebe Gott,<\/div>\n\n\n\n<div>Dass ich nur alles schon vernommen habe!<\/div>\n<\/blockquote>\n\n\n\n<p>Zusammen bestehen dann jeweils zwei fett gedruckte Zeilen aus f\u00fcnf Jamben &#8211; einem Vers. Also kriegen diese Zeilen &#8211; in meiner Vorlage gl\u00fccklicherweise daran erkennbar, dass dem Sprechernamen keine eigene Zeile gegeben wird &#8211; eine Formatvorlage &#8222;Halbzeile&#8220; zugewiesen, f\u00fcr die gilt, dass sie bei der Zeilenz\u00e4hlung ignoriert wird.<\/p>\n\n\n\n<p>Das war umst\u00e4ndlich und erforderte bei allem gewitzten Suchen\/Ersetzen dann doch noch manuelle Eingriffe. Keine L\u00f6sung gibt es f\u00fcr den Fall, dass ein Vers l\u00e4nger ist als eine Zeile, so dass am Seitenrand umbrochen und eine zus\u00e4tzliche Zeile gez\u00e4hlt wird. Und es reicht mir eigentlich noch nicht. Am liebsten h\u00e4tte ich zum Beispiel auch noch die M\u00f6glichkeit, alle \u00c4u\u00dferungen Nathans in einer, die der Daja in einer anderen Farbe darzustellen.<\/p>\n\n\n\n<p>Dazu br\u00e4uchte ich den Text zum Beispiel in einem XML-Format. Das k\u00f6nnte dann so aussehen:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>&lt;dialog&gt;\n&nbsp; &lt;sprecher person=Daja&gt;\n&nbsp;&nbsp;  &lt;vers&gt;Er ist es! Nathan! \u2013 Gott sei ewig Dank,&lt;\/vers&gt;\n&nbsp;&nbsp;  &lt;vers&gt;Dass Ihr doch endlich einmal wiederkommt.&lt;\/vers&gt;\n&nbsp; &lt;\/sprecher&gt;\n&nbsp; &lt;sprecher person=Nathan&gt;\n&nbsp;&nbsp;  &lt;vers&gt;Ja, Daja; Gott sei Dank! Doch warum endlich?&lt;\/vers&gt;\n&nbsp;&nbsp;  &lt;vers&gt;Hab ich denn eher wiederkommen wollen?&lt;\/vers&gt;\n&nbsp; &lt;\/sprecher&gt;\n&lt;\/dialog&gt;<\/code><\/pre>\n\n\n\n<p>Alles, was ein <code>&lt;vers&gt;<\/code> ist, wird beim Nummerieren einmal gez\u00e4hlt, auch wenn der <code>&lt;vers&gt;<\/code> mal so lange ist, dass er beim Druck auf zwei Zeilen verteilt werden w\u00fcrde. Eine <code>&lt;regieanweisung&gt;<\/code> kann mitten in einem <code>&lt;vers&gt;<\/code> stehen oder auch nicht. Die Antilabe behandelt man so:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>&lt;sprecher person=Daja><br> \u00a0 &lt;vers typ=Ende>O Nathan,&lt;\/vers><br> \u00a0 &lt;vers>Wie elend, elend h\u00e4ttet Ihr indes&lt;\/vers><br> \u00a0 &lt;vers typ=Anfang>Hier werden k\u00f6nnen! Euer Haus...\/vers><br> &lt;sprecher><br> &lt;sprecher person=Nathan><br> \u00a0 &lt;vers typ=Ende>Das brannte.&lt;\/vers><br> \u00a0 &lt;vers>So hab ich schon vernommen. \u2013 Gebe Gott,&lt;\/vers><br> \u00a0 &lt;vers>Dass ich nur alles schon vernommen habe!&lt;\/vers><br> &lt;\/sprecher><\/code><\/pre>\n\n\n\n<p>Verse werden dabei als Ganzvers oder als Halbvers (Typ: Anfang, Mitte, Ende) markiert. Damit enth\u00e4lt der annotierte Text alle wichtigen Informationen. Was ein Textverarbeitungs- oder auch ein ganz anderes Programm* damit anstellt, ist dessen Sache.<\/p>\n\n\n\n<p>F\u00fcr Shakespeare gibt es schon mehrere XML-Projekte, hier sind <a href=\"http:\/\/www.ibiblio.org\/xml\/examples\/shakespeare\/\">zum Beispiel alle St\u00fccke in einem XML-Format<\/a> zum Anschauen und Herunterladen. Eine ausgefeiltere Markierung wird <a href=\"http:\/\/www.tei-c.org\/release\/doc\/tei-p4-doc\/html\/DR.html\">bei der Text Encoding Initiative vorgestellt<\/a>, eine <a href=\"http:\/\/de.wikipedia.org\/wiki\/Text_Encoding_Initiative\">\u00fcbersichtlichere Zusammenfassung davon bei Wikipedia<\/a>.<\/p>\n\n\n\n<p>Ich spreche dauernd von &#8222;einem XML-Format&#8220;, weil XML der \u00dcberbegriff f\u00fcr derartige Formatierungen ist. RSS-Feeds, OpenOffice-Dateien, docx, svg-Grafiken, GoogleEarth-Routen sind alles Formen von XML. Das Format der Text Encoding Initiative ist wohl ein verbreiteter Standard f\u00fcr Texte. Auf der <a href=\"http:\/\/www.tei-c.org\/Activities\/Projects\/\">Liste von TEI-Projekten<\/a> finde ich an deutscher Literatur eigentlich nur <a href=\"http:\/\/www.tei-c.org\/Activities\/Projects\/ju01.xml\">Der junge Goethe<\/a> der LMU M\u00fcnchen &#8211; 2 CDs voller Material, nicht online. Au\u00dferdem ein Projekt Berliner Intellektuelle 1800-1830 der Humboldt-Universit\u00e4t, wo f\u00fcrs erste Quartal 2012 ein <em>Sandmann<\/em> angek\u00fcndigt ist. Und schlie\u00dflich gibt es das <a href=\"http:\/\/www.deutschestextarchiv.de\/books\/\">Deutsche Textarchiv<\/a>, wo bereits recht viele deutschsprachige B\u00fccher in diesem Format erfasst sind &#8211; allerdings philologisch sehr sauber gemacht, mit den urspr\u00fcnglichen Seiten- und Zeilenumbr\u00fcchen, also f\u00fcr das Lesen weniger geeignet. Man kann sich die B\u00fccher als Scan anschauen oder als Text, die XML-Datei auch herunterladen, falls man mit ihr etwas anfangen wollte.<\/p>\n\n\n\n<p>W\u00e4re doch alles mal etwas f\u00fcr ein W-Seminar Deutsch\/Informatik?<\/p>\n\n\n\n<p><small>*Es gibt zum Beispiel ein Programm, das die Beziehung von Personen in sozialen Netzwerken analysiert und grafisch darstellt. Das l\u00e4uft nicht \u00fcber XML, soweit ich wei\u00df, aber eine XML-markierte Eingabe w\u00fcrde auch da die Weiterverarbeitung erleichtern. <a href=\"http:\/\/www.jibble.org\/shakespeare\/\">Hier wurde das Programm auf die St\u00fccke Shakespeares angewendet,<\/a> und man kann in Videos sehen, wie sich die Beziehungen zwischen den Figuren im Lauf des St\u00fccks ver\u00e4ndern.<\/small><\/p>\n\n\n\n<p>Und falls jemand meine digitale Nathan-Fassung (.odt) braucht: <a href=\"https:\/\/www.herr-rau.de\/wordpress\/archiv\/Nathan_Text.odt\">hier ist sie<\/a>, sicher noch nicht ganz fehlerfrei. F\u00fcr den Alltag braucht man allerdings ohnehin nur k\u00fcrzere Ausschnitte, die man sich schneller auf andere Weise zurechtformatieren kann.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>(2 Kommentare.) Ich vertrat mal eine Klasse, die eigentlich Nathan der Weise lesen sollte, in der die Lehrkraft aber erkrankt und die Lekt\u00fcre noch nicht da war. Langsam eilte es ein wenig, fand ich, deshalb gab ich den Sch\u00fcler erst einmal eine digitalisierte Nathan-Version f\u00fcr die Lekt\u00fcre zu Hause und f\u00fcr den Computerraum, in dem [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[101,25],"tags":[231,227],"class_list":["post-3625","post","type-post","status-publish","format-standard","hentry","category-deutsch","category-informatik","tag-deutsch","tag-informatik"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"jetpack_likes_enabled":true,"_links":{"self":[{"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/posts\/3625","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/comments?post=3625"}],"version-history":[{"count":3,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/posts\/3625\/revisions"}],"predecessor-version":[{"id":58089,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/posts\/3625\/revisions\/58089"}],"wp:attachment":[{"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/media?parent=3625"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/categories?post=3625"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.herr-rau.de\/wordpress\/wp-json\/wp\/v2\/tags?post=3625"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}