Ich habe jetzt endlich mein Greenfoot-Reinforcement-Material (siehe alter Blogeintrag, und die davor) aufgeräumt, vereinfacht und dokumentiert. Das habe ich zwar schon vor ein Tagen verkündet, aber jetzt gilt es wirklich. Und zwar ich habe das ganze Projekt nach Github Codeberg verlegt:
https://codeberg.org/HerrRau/GreenfootReinforcementLearning/#readme
Dort kann ich meine Verbesserungen aktuell halten und die Anleitung ständig erweitern. Sie beginnt so:
Das hier ist ein Greenfoot-Projekt mit mehreren eigentlich voneinander unabhängigen rudimentären Spielen: Ein einfaches Breakout, ein einfacheres Autorennen, ein Snake. Sie sind alle deshalb in einem Projekt, weil sie alle die gleiche zusätzliche Infrastruktur nutzen, um nämlich automatisierte Bots alleine oder gegeneinander spielen zu lassen. Diese Bots können durch KI-Agenten gesteuert werden (Reinforcement Learning) oder, insbesondere bei Snake, auch einen einfachen Algorithmus verwenden, wie er von Schülern oder Schülerinnen entwickelt werden könnte.
- Man kann sich das Greenfoot-Projekt herunterladen, und dann erst einmal einfache Versionen von Breakout, primitivem Autorennen und Snake spielen.
- Dann kann man die vorgegebenen KI-Lösungen für diese Spiele ausprobieren.
- Dann kann man den Rest der Anleitung lesen und versuchen herauszufinden, wie das überhaupt alles funktioniert, erläutert an einem Minimalbeispiel.
- Und zuletzt gibt es ein Beispiel für ein Labyrinth-Minispiel, für das es noch keine KI-Lösung gibt – die kann man dann selber zu schreiben versuchen, unterstützt durch die Kommentare im Code.
(Warum Github? Weil ich da schon ein Konto habe. Gerne ziehe ich anderswohin um; laut Informatik-Lehrplan der Oberstufe sollen die Schüler und Schülerinnen mit Versionsverwaltung arbeiten, das Kultusministerium stellt aber keine Infrastruktur zur Verfügung, sprich: einen git-Server. Könnte man da nicht etwas mit ByCS machen? Immerhin war neulich die Rede davon, dass die Schulen sich bald ministeriell geprüfte Lösungen dafür kaufen dürfen. Nachtrag: Probiere gerade Codeberg aus.)




Die Farbgebung beim Labyrinth ist bewusst gewählt; man könnte das Spiel ja noch erweitern (Wizard of Wor, wer’s noch kennt). Aber die KI tut sich schon jetzt bei vielen Settings nicht leicht, vielleicht ist auch hier ein stupider Algorithmus besser als ein künstlich intelligenter.
Im Moment sitze ich noch beim Training für eine einfache Rohversion von Tron: Deadly Discs. Und selbst auf einer arg reduzierten Miniwelt der Größe 18 x 12 dauert der Lernvorgang sehr, sehr lange – da merkt man richtig, wie viele Ressourcen so ein Training erfordert.
Schreibe einen Kommentar