Datenschutz und Data-Mining (9. Klasse)

(4 Kommentare.)

Informatik, 9. Klasse, neuer Lehrplan, also zum ersten Mal diese Themen in dieser Ausführlichkeit. Zu Datenschutz halt das Übliche: wer speichert welche Daten, was kann man dagegen machen, was muss oder möchte man hinnehmen, warum ist das überhaupt ein Problem.

Richtig klar wird das erst, wenn man auf der anderen Seite steht: Man hat Daten und kann sie auswerten. Wenn man erst einmal in Datensätzen gespielt hat wie in einem großen Sandkasten, dann ahnt man: Daten sind etwas wert, und wer sie erst einmal hat, der gibt sie ungern wieder her.

Also zeigte ich meinen 9. Klassen Daten zum Spielen.

1. Google Trends

Beispiel: https://trends.google.de/trends/explore?date=today%205-y&geo=DE&q=Geschenke

Hier kann man sich anzeigen lassen, nach welchen Suchbegriffen bei Google gesucht wurde, innerhalb eines wählbaren Zeitraums, eventuell begrenzt auf eine bestimmte Region, eventuell im Vergleich zu anderen Suchbegriffen. Was man herausfinden kann: “Geschenke“, über mehrere Jahre beobachtet, hat eine Spitze Mitte Dezember und eine Anfang Februar – Weihnachten und Fasching. “Sonnencreme“ hat ebenfalls jährliche Spitzen, insgesamt steigend.

2. Google Ngrams

Beispiel: https://books.google.com/ngrams/graph?content=Dracula%2CSherlock+Holmes%2CFrankenstein%2C+Tarzan&year_start=1800&year_end=2019&corpus=26&smoothing=3&direct_url=t1%3B%2CDracula%3B%2Cc0%3B.t1%3B%2CSherlock%20Holmes%3B%2Cc0%3B.t1%3B%2CFrankenstein%3B%2Cc0%3B.t1%3B%2CTarzan%3B%2Cc0

Hier geht es nicht um Suchaufrufe, sondern man kann Textkorpora durchsuchen: Gedruckte Bücher und Zeitungen, was Google halt so alles digitalisiert hat, kann man nach der Häufigkeit von Wörtern durchsuchen, nach Sprachen und Zeiträumen sortiert.

Auftrag an die Schüler und Schülerinnen jeweils: Findet etwas Interessantes und schreibt den Link mit einer kurzen Erklärung oder Deutung dazu in das vorbereitete Mebisforum. (Screenshot optional.)

Ergebnisse

Themen, nach denen die Schüler und Schülerinnen recherchierten, nicht notwendigerweise die exakten Suchbegriffe, aus diesem Ergebnisforum:

  • Altkanzlerin
  • Cocaine vs Cannabis (USA: deutliche Unterschiede zwischen Süden und Ostküste auf der einen, Westküste und mittlerem Westen auf der anderen Seite)
  • Covid-19: Vergleich von Pandemie, Covid-19, Impfpflicht, homeschooling (Erkenntnis: „homeschooling“ interessierte so gut wie niemanden)
  • Evolution (mit einer Spitze Mitte 2018: wegen des Spiels Jurassic Wolrd Evolution)
  • Greta Thunberg
  • Haustier (tatsächlich leichter Anstieg mit Pandemiebeginn)
  • Impfung
  • insta vs tiktok
  • Ischgl
  • Justin Bieber
  • Konsolen Such Vergleich
  • Logan Paul (interessante Spitzen, aber leider ohne Erklärung dafür: ich hätte selber ein paar Skandale des Youtubers nennen können – nimm das, junge Generation!)
  • Ironman (unerklärte regelmäßige Spitzen, Hypothese war: Film – aber ich denke, es hat eher etwas mit Sportwettbewerben zu tun)
  • Marvel Serien
  • Oktoberfest
  • Olympia
  • Spiderman (sic)
  • Streaminganbieter, Vergleich: Netflix, Amazon Prime, Disney+
  • Vergleich Urlaub, Impfung
  • Verschiedene Feiertage: Weihnachten, Ostern, Silvester, August (keine Überraschungen bei den Ergebnissen)

Beobachtet, aber nicht schriftlich festgehalten: onlyfans, pornhub (unterschiedlich viele Anfragen je nach Tageszeit), hentai vs porn (Hessen anders als andere Bundesländer). „Putsch“ hat eine große Spitze im Juli 2016 (wer weiß es noch?). Eine Schülerin war mitgenommen davon, dass Trump 2016 gewählt wurde, weil sie sich noch daran erinnern konnte und sich plötzlich sehr alt fühlte. Und „Dritter Weltkrieg“ hat sehr deutliche Spitzen September 2021, Februar 2022 (ups) und Januar 2020 (was war da?).

3. Google Standortverlauf

Beispiel (man muss das eingeschaltet haben und eingeloggt sein)

(Auf dem Bild sieht man, wie ich am 1. Januar 2020 nach Venedig gefahren bin. Wenn man nach Venedig hineinzoomt, sieht man genau, wo ich zu Fuß unterwegs war, und demnach auch, wo ich übernachtet habe.)

Wer ein Android-Handy mit Google-Anmeldung hat, kann Google erlauben, den Standort zu speichern, und das ständig. So kann man sich auf der Karte zeigen lassen, wo genau man vor 1 Jahr war, oder vor 2 Jahren, welche Verkehrsmittel man an einem konkreten Tag benutzt, welche Orte man besucht hat. Man muss Google gar nicht sagen, ob man ein Auto hat oder einen Partner oder wo man wohnt oder wo man einkauft oder wo man gerne zu Abend isst: das ergibt sich aus diesen Daten ja alles ganz von selbst.

4. Google Aktivitäten

Beispiel (man muss eingeloggt sein)

Hier kann man sich anzeigen lassen, nach welchen Begriffen man selber gesucht hat, welche Seiten man besucht, welche Videos man angeschaut hat, wie man sie bewertet hat – kurz: alle Google-Aktivitäten.

5. Orange Data-Mining

Oh my. Das ist eine Suite zum Analysieren von großen Datenmengen, und mehrere eigene Blogeinträge wert. Denn damit kann man viel machen. Also, richtig viel. Das kommt aber erst nächste Woche in die Klassen.


Beitrag veröffentlicht am

in

Kommentare: 4

Schlagwörter:

Kommentare

4 Antworten zu „Datenschutz und Data-Mining (9. Klasse)“

  1. Aginor

    Achja, der Datenschutz. Habe beruflich damit zu tun (naja, wer nicht…) und ich merke auch häufiger dass Menschen jeden Alters (nicht nur Jugendliche oder Alte wie oft behauptet) teilweise _keine_ Ahnung haben was von ihnen wo überall erfasst, gespeichert, und auch verarbeitet wird. Und wie wenig sorgfältig teilweise damit umgegangen wird.

    Und welche Möglichkeiten man da hat.
    Kleine Anekdote dazu: Ich bin einmal mit jemandem in Kontakt gekommen der meinte dass es ja nicht so schlimm sei, dass das Einwohnermeldeamt jetzt die Daten verkaufen darf (Das Gesetz ging IIRC während eines Deutschlandspiels der Fußball-WM 2012 durch den extrem unterbesetzten Bundestag, allein das sagt schon etwas aus).
    Da ich beruflich in der Vergangenheit mit solchen Daten zu tun hatte und weiss was da alles drinsteht (also die Spalten der Tabelle sozusagen) habe ich einfach mal ein paar Pseudocode Datenbankabfragen geschrieben und an denen erklärt was man da alles herausfinden kann. Wenn man das auch noch mit anderen Daten verschneiden kann dann ist das schon gruslig. Und alles andere als science fiction, sondern die gegenwärtige Realität.

    Auf schulischer Ebene bin ich beeindruckt, die Schule meiner Tochter (Ba-Wü) hat ein erstaunlich vollständiges Datenschutzkonzept und zieht diese Dinge augenscheinlich recht strikt durch. Das ist zwar manchmal mit Mehraufwand verbunden, aber ich bewerte das positiv. Und die Schüler werden von Anfang an auch an den Umgang mit persönlichen Daten herangeführt.

    Gruß
    Aginor

  2. Daten vom Einwohnermeldeamt: Das war das mit dem Listenprivileg, oder? Das habe ich gerne als Beispiel genommen für das, was eigentlich nicht möglich sein sollte. Und ja, wie das aufrechterhalten wurde, widerlich. Aber das gilt jetzt mit der DSGVO endlich nicht mehr, glaube ich.

    (Meine Schule und der Datenschutz: Mittel. Wie achten ziemlich gut darauf, aber erklären niemandem, warum wir das tun.)

  3. Aginor

    Leider gab es das mehrfach.

    Das Listenprivileg wurde mit der DSGVO (beschlossen 2016, in Kraft 2018) abgeschafft.
    Änderungen an Gesetzen die diese Daten betreffen gab es (so aus dem Stegreif) 2008 als auch das Listenprivileg kam, und zuletzt 2012 im Meldegesetz, das war das während der Fussball-WM durchgewunkene.
    Wurde IIRC dann wenigstens vom Bundesrat abgeschwächt. Vor allem kritisiert wurde dass das ganze Opt-out anstatt Opt-in war. Die haben gewusst dass kaum jemand ja sagen würde wenn man ihn oder sie fragt.
    EDIT: Besonders pikant: Die Fassung die die meisten Leute gelesen hatten und die wesentlich verbraucherfreundlicher war wurde wenige Tage vorher noch kurzerhand von Parlamentariern der Union und der FDP im Innenausschuss abgeändert, so wusste kaum jemand was da im Gange war.

    Als ich zuletzt reingeschaut habe waren die Klauseln meines Wissens auch noch alle drin, ich bin nicht sicher ob die nur unwirksam sind durch die DSGVO oder ob da noch eine Änderung ansteht. Es ist (wie vieles in dem Bereich) ein wenig kompliziert.
    Aber selbst nach den Anonymisierungen und Aggregationen die die Veröffentlichung dann erlauben würden kriegt man gruslig präzise Infos aus den Daten raus, wohnblockscharf.

    Alle Angaben natürlich ohne Gewähr, ich bin kein Jurist und auch im Moment leider ein wenig aus der Materie raus.

    Gruß
    Aginor

  4. Vielen Dank für die zusätzlichen Informationen. Ich finde das ja sehr interessant und wichtig, habe aber keine Zeit gehabt, das weiter zu verfolgen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert