Wer ein Wordpress-Blog führt, will vielleicht wissen, wie viele Leute einen Blogeintrag lesen, oder welche anderen Seiten auf einen Blogeintrag verweisen. Vor zehn oder zwanzig Jahren war es üblich, dass man das macht, auch weil das neu war und technisch möglich und Statistiken etwas Interessantes haben. Inzwischen sind Blogs noch mehr Nische geworden, Google funktioniert nicht mehr, Statistiken sind nicht mehr so spannend, die DSGVO kam dazu, so dass viele Blogs gar nicht mehr so groß mitzählen, glaube ich.
Die Aufrufzahlen sind allerdings relevant, wenn man Blogbeiträge bei der VG Wort angemeldet hat – wenn diese eine bestimmte Länge haben und eine bestimmte Mindestzahl an Aufrufen haben, gibt es einen – fixen, von Länge und Aufrufzahl unabhängigen – Geldbetrag dafür. Das funktioniert aber ganz unabhängig von einer eventuellen anderen Statistik, indem ein sogenannter Zählpixel in den Blogeintrag aufgebaut wird. Der Zählpixel ist ein winzigkleines und praktisch unsichtbares Bild, das auf den Servern der VG Wort liegt. Wenn jemand eine Seite besucht, auf der dieser Zählpixel eingebunden ist, wird dieser Zählpixel vom VG-Wort-Server heruntergeladen; bei diesem Herunterladen werden Informationen übermittelt und insbesondere die Tatsache des Herunterladens kann dokumentiert und gespeichert werden. So ermittelt die VG Wort, wie oft eine Seite aufgerufen wurde. Vermutlich speichert die VG Wort wenig außer der absoluten Zahl an Aufrufen, also insbesondere keine personenbezogenen Daten (wie die IP-Adresse, von der der Aufruf kam), so dass keine explizite DSGVO-Einwilligung nötig ist.
(Funktioniert das mit der VG Wort? Ich weiß es nicht; es kann sein, dass die üblichen verbreiteten Datenschutzplugins, die viele Leute in ihrem Browser installiert haben, ich ja auch, diese externen Aufrufe von Zählpixeln unterbinden. Das habe ich nicht überprüft.)
Technisch sind diese Statistiken möglich, weil – so funktioniert das Web – bei jedem Aufruf einer Seite oder auch nur eines einzelnen Bildes Informationen mitgeschickt werden über die aufrufende Stelle, also unter anderem: welcher Browser, welches Betriebssystem, welche Fenstergröße, die IP-Adresse des Aufrufs, eventuell die HTML-Seite, von der aus der Aufruf ausgelöst wurde. Das sind teilweise personenbezogene Daten, die immer mit übermittelt werden, und wenn man die speichert, muss man sich an gesetzliche Regelungen wie die DSGVO halten, und wenn man Lehrkraft ist, muss man noch einmal besonder aufpassen, welche personenbezogenen Daten man Schüler und Schülerinnen so zwingt preiszugeben.
Technisch ist es aber auch gar nicht so einfach, diese Aufrufstatistiken zu deuten: Will man Bot-Besuche mitzählen; kann man die überhaupt erkennen? Wenn ein Mensch eine Seite zweimal direkt hintereinander lädt, soll man das als einen Besuch zählen oder als zwei? Und wenn zehn Minuten dazwischen liegen? Um festzustellen, ob das derselbe Mensch ist, oder jedenfalls derselbe Rechner, muss man ja Informationen speichern, und da sind wir wieder bei den personenbezogenen Dateb.
Ich habe mich lange nicht mehr mit diesen Statistiken beschäftigt, mir jetzt aber aus Gründen angeschaut, was es das für Möglichkeiten dafür gibt, insbesondere für WordPress.
1. Software des Hosters
Die Webseiten-Anbieter, auf denen man eine Wordpress-Installation laufen hat, bieten oft selber eine Statistiksoftware an. Die kann man ein- oder ausschalten und konfigurieren. Bei mir heißt die Software <müsste nachschauen> und bietet solche Grafiken:

Wie gesagt, man müsste das erst deuten, und sich die Details anschauen, die recht umfangreich und ungefiltert sind und auch nicht speziell für das Blog gelten, sondern für den gesamten Webspace, der mitunter, wie in meinem Fall, auch für vieles andere genutzt wird. Wenn man hierbei personenbezogene Daten speichert, muss man das angeben und die Erlaubnis dazu einholen. Erlaubnis kriegt man zum Beispiel mit Cookies. Aber eigentlich möchte man diese Cookie-Akzeptiererei vermeiden: Wenn man nichts tut, weswegen man um Erlaubnis fragen muss, braucht man auch keine Cookies, und für einfache Statistiken braucht man die auch nicht.
2. Jetpack
Jetpack ist das Plugin der Wordpress-Mutterfirma. Wenn man es installiert, kann man das Blog über Wordpress abonnierbar machen, Wordpress-Likes anzeigen, kriegt Schutz vor Kommentarspam, ein bisschen Schutz vor Hackerangriffen und zusätzliche gestalterische Elemente, kann außerdem E-Mail-Newsletter verschicken (und Antworten darauf eventuell automatisch als Kommentar ins Blog einbinden) und vieles mehr, darunter eben auch Statistiken, die zum Beispiel so aussehen:

Und man kriegt noch viel mehr Auswertung dabei, wenn man möchte. Allerdings geschieht die Auswertung und Speicherung dabei nicht auf dem eigenen Server, sondern auf den Servern der amerikanischen Firma Automattic. Auch hier muss man angeben und um Erlaubnis fragen, wenn personenbezogene Daten gespeichert werden – nur muss man dabei manuell genau einstellen, welche Daten Automattic speichern soll und welche nicht, und dann geht das auch DSGVO-konform. Schreibt Automattic, und das wird schon stimmen, auch wenn man natürlich keine Kontrolle darüber hat, was auf deren Servern wirklich geschieht. Und wenn die amerikanische Regierung irgendwelche Daten will, kriegt sie die sicher.
3. Statify
Das Wordpress-Plugin „Statify“ speichert gar keine personenbezogenen Daten, es zählt nur Aufrufe, keine Besuche. (Als ein Besuch zählt ja, wenn eine Besuchende innerhalb eines relativ kurzen Zeitraum sich mehrere Seiten ansieht, und um das zu ermitteln, muss man die personenbezogene IP-Adresse zumindest kurzzeitig speichern.) DSGVO-konform, keine Cookie-Zustimmung erforderlich. Natürlich sollte man auf der Datenschutz-Seite trotzdem darauf hinweisen.

4. Google Analytics
Es ist Jahre her, dass ich den Begriff gehört habe, bis ich kürzlich auf Mastodon nach Statistik-Möglichkeiten gefragt habe. Ich hatte es vor zehn oder mehr Jahren sicher auch mal verwendet. Google Analystics gibt einem viele Daten, viel mehr als man braucht, und – ohne nachzusehen – behauptet sicher auch, DSGVO-konform zu sein. Und vielleicht kann man auch das Cookie-frei verwenden. Aber auch hier liegt halt alles auf amerikanischen Servern, und überhaupt.
5. Matamo
Davon hatte ich noch nie gehört. Bis ich dann unter der Haube sah, dass es der aktuelle Name von dem ist, was früher mal Piwik hieß, und das wiederum hatte ich vor zehn oder mehr Jahren auch mal installiert. Matamo stellt sich als Alternative zu Google Analytics auf, ist also ein sehr mächtiges Wekrzeug, nur ohne Google. Man kann es wieder auf einem Server der Firma laufen lassen, oder man kann die quelloffene Software auf dem eigenen Server laufen lassen, so dass man die volle Kontrolle über die Daten behält, oder man kann – wenn einen nur das Blog interessiert und nicht der ganze Webspace – das Plugin „Matomo Analytics“ installieren. Das läuft dann ebenfalls auf dem eigenen Server, und man kann es auch DSGVO-konform einrichten, und keine personenbezogenen Daten speichern.
Das hier ist die einfache Ansicht, es gibt auch noch eine erweiterte mit sicher ebenso vielen Details wie bei den anderen detailreichen Programmen. Aber da tauchen Wörter auf wie „Verhalten“, „Akquisition“ und „Ziele“, nichts was irgend jemand, den ich bloggend kenne, wohl braucht.

6. Burst Statistics
Burst Statistics ist eine kostenpflichtige Alternative zu Google Analytics und Matamo, es gibt aber auch ein kostenloses Wordpress-Plugin. Mächtig, aber einschränkbar, man kann es so einstellen, dass man keine Cookies braucht. Burst wirbt auf den FAQ-Seiten zwar für Cookies, weil die sehr transparent seien und dem Enduser viel Kontrolle überließen – aber sie nerven halt.
Außerdem musste ich dabei drei weitere Plugins, die mir zur Benutzung empfohlen wurden, aktiv abwählen, damit sie nicht installiert werden. Damit ist das Produkt schon mal indiskutabel für mich. Mich an „Do not track“ zu halten, muss ich erst einschalten, das dürfte Standard sein.
Dafür erhalte ich schön übersichtlich (aber das ist sicher mit den anderen größeren Möglichkeiten ähnlich) das hier:

Und das heißt:
- drei Leute treiben sich gerade auf der Seite herum und sehen sich verschiecene Sachen an (das sind die obersten drei Einträge)
- eine Person ist gerade durch direkte Eingabe der Browseradresse frisch auf das Blog gekommen und noch auf der Startseite (das ist der vierte Eintrag)
- eine Person hat sich vor kurzem die Eisbären-Seite angeschaut und danach bis jetzt nichts anderes mehr getan, liest also noch oder hat das Blog längst verlassen (das ist der gelbe Eintrag)
- eine Person hat das Blog auf der Seite „Meine Mutter als Programmiererin“ via Google betreten und seitdem nichts mehr getan (das ist der rote Eintrag)
Und mehr kriegte ich sicher durch weitere Klicks zu sehen. Wenn man alle Daten speicherte, sähe man schnell, wer wie oft und wie lange auf welchen Seiten ist, und wenn das von fixen IP-Adressen aus geschieht (Arbeitsstelle, Schule), könnte man auch spekulieren, wer das ist. Das sind also schon erst einmal schützenswerte Daten.
So, und in ein, zwei Tagen schalte ich das alles wieder ab. Ich freue mich aber über Tipps und Austausch, was ich denn nun empfehlen soll, wenn mich jemand danach fragt.
Schreibe einen Kommentar