Maschinelles Lernen in der Logistik

Im Modul Maschinelles Lernen in der Logistik (Master, 3. Semester) werden neben klassischen Medien wie Präsentationsfolien und Arbeitsblättern auch Jupyter Notebooks eingesetzt. Sie dienen zur Visualisierung und Auswertung von Daten. Gleichzeitig bietet das Dateiformat Jupyter Notebook es an, die einzelnen Arbeitsschritte sauber zu dokumentieren. Solch ein Vorgehen ist sehr wichtig, um die Daten aus dem eigenen Unternehmen oder der eigenen Behörde für alle Beteiligten "begreifbar" zu machen.

Im Bereich der Logistik müssen verschiedene Besonderheiten berücksichtigt werden, die nicht (immer) in der Einstiegsliteratur zum Thema Maschinelles Lernen abgedeckt werden: Es gibt elementare Unterschiede bei dem Arbeiten mit zeitbehafteten Daten, raumzeitlichen Daten sowie Bilddaten. Auslastungsprognosen an einem logistischen Knoten sind ein typisches Beispiel für zeitbehaftete Daten. Verkehrsdaten, insbesondere GPS-Tracks von Ladungen und Fahrzeugen, werden hingegen als raumzeitliche Daten bezeichnet und entsprechend ausgewertet. Darunter fallen auch Schiffsbewegungen einer (in Zukunft vielleicht autonomen) Containerschiff-Flotte. Die automatische Bilderkennung bei autonomen Verkehrsmitteln spielt schon heute eine große Rolle. Aufgrund dieser Vielfalt von Daten eignen sich Jupyter Notebooks, denn die im Hintergrund arbeitende Programmiersprache Python verfügt über eine große Auswahl von bewährten Bibliotheken, mit denen man diese Daten visualisieren und auswerten kann. Deswegen werden ein Großteil der Übungsaufgaben mit Jupyter Notebooks gestellt.

Für einen runden Abschluss des Moduls wird ein Teil der Prüfung digital durchgeführt. Deswegen findet die Prüfung in einem für E-Prüfungen vorbereiteten Raum statt. Jeder*m Studierenden wird ein speziell präparierter Laptop gestellt. Während der gesamten Bearbeitungszeit dürfen sich die Studierenden frei aussuchen, wann sie die Aufgaben am Laptop und wann die Aufgaben auf Papier bearbeiten möchten. Die bearbeiteten digitalen Aufgabenzettel werden am Ende automatisch eingesammelt und zusätzlich zur Papierklausur zur Bewertung herangezogen.

Am Laptop werden Kompentenzen in der interaktiven Programmierung abgeprüft. Mithilfe der IDE Jupyter Notebook werden Programmieraufgaben gestellt. Der Code, den die Studierenden schreiben, können sie gleich in der IDE ausprobieren. Fehlermeldungen des Interpreters weisen sie ggf. auf Syntaxfehler hin. Visualisierungen von Datensätzen werden interaktiv angezeigt. Damit ist die Prüfungssituation dem Arbeitsalltag von Data Scientists deutlich ähnlicher als wenn man mit Stift und Papier programmiert. Die didaktischen Möglichkeiten werden beim digitalen Freischwimmer des ZLL genauer ausgeführt.

Für die technische Durchführung ist auf einer von dem Rechenzentrum gestellten virtuellen Maschine die Anwendung JupyterHub installiert worden. Auf jedem der Laptops wird der Prüfungs-Browser so eingerichtet, dass dieser sich mit der virtuellen Maschine verbindet. Dadurch wird der Aufwand zur Einrichtung der Laptops minimiert und die virtuelle Maschine kann im Vorwege in Ruhe von der*m Prüfungsverantwortlichen eingerichtet und auf Herz und Nieren überprüft werden. Details zur Implementierung sind im INSIGHTS-Blog des Institut für Technische Bildung & Hochschuldidaktik erklärt worden. Die in dem Artikel aufgeführte Beispiel-Implementierung kann von Interessierten vom git-Repository auf der TUHH-GitLab-Instanz bezogen werden.

Neben der technischen Machbarkeit müssen weitere Aspekte berücksichtigt werden, wie z. B. die Einhaltung des Datenschutz oder der Archivierung der Prüfungsergebnisse. Dies erfordert eine sorgsame Vor- und Nachbereitung der Prüfung. Diese Aspekte des ersten Durchlaufs der E-Prüfung wurde 2019 auf dem E-Prüfungs-Symposium in Siegen als Plakat vorgestellt. Bei weiteren Fragen oder für einen allgemeinen Meinungsaustausch kontaktieren Sie gerne Marvin Kastner.