Die Information-Bottleneck-Methode in der Corona Pandemie

16.02.2021

- Prof. Dr.-Ing. Gerhard Bauch, Institut für Nachrichtentechnik -

Auch die Forschung am Institut für Nachrichtentechnik unter der Leitung von Prof. Gerhard Bauch wird durch die aktuellen Corona Maßnahmen stark beeinträchtigt. Normalweise forschen die Mitarbeiter zu modernen Übertragungstechnologien im Bereich 5G, Algorithmen zur Lokalisierung sowie dem Einsatz von Machine Learning zum Entwurf zukünftiger Kommunikationssysteme.

Ein besonderer Fokus liegt hierbei auf Methoden der angewandten Informationstheorie. Die Informationstheorie erlaubt es den Informationsgehalt von Nachrichten mathematisch zu quantifizieren. Dadurch ist es möglich Information zu komprimieren sodass nur die relevante Information erhalten bliebt oder aber Redundanz einzufügen, um eine besonders wichtige Nachricht zusätzlich zu schützen. Man spricht hierbei von Quellencodierung bzw. Kanalcodierung. Am Institut für Nachrichtentechnik wird ein besonderes Tool aus dem Bereich des maschinellen Lernens, die sog. „Information Bottleneck Methode“ besonders eingesetzt um effiziente Signalverarbeitungsalgorithmen zu entwerfen und zum Beispiel den Energieverbrauch sowie die Latenz mobiler Endgeräte zu reduzieren.

Allerdings erlauben die verwendeten Methoden auch den Einsatz in generischen Fragestellungen und allgemeinen Anwendungen im Bereich Big Data. Im Rahmen seiner Projektarbeit beschäftigte sich Semir Cömertpay zusammen mit seinem Betreuer Maximilian Stark mit dem Einsatz der Information Bottleneck Methode zur Bekämpfung der Covid19 Pandemie. Ein besonderer Fokus lag hierbei auf der Identifikation von besonders gefährdeten, vulnerablen Bevölkerungsgruppen. Basierend auf Rohdaten des RKI wurde die Entwicklung der Corona Pandemie informationstheoretisch untersucht und neuartige Unterteilungen in Risikogruppen anhand des Altersprofils und Geschlechts ermittelt. Abbildung 1 zeigt die so gefundene optimale Einteilung der Bevölkerung für verschiedene Abstufungen, das heißt für verschiedene Anzahlen von Gruppen. Gleichzeitig wird das Verhältnis der erhaltenen Information bezogen auf die Gefährdung von Bevölkerungsgruppen (bestimmt durch die Sterberate infolge einer Infektion) angezeigt. Es zeigt sich, dass aus informationstheoretischer Sicht eine Betrachtung von 6 Gruppen optimal wäre. Interessant ist zusätzlich, dass besonders zusätzlich zum Alter bei über 80 Jährigen das Geschlecht von besonderer Bedeutung ist.

Methoden, die wir üblicherweise für völlig andere Fragestellungen einsetzen, können also genutzt werden, um durch tiefere Einblicke in die vorhandenen Daten mögliche Schutzkonzepte sowie Erkenntnisse zum Infektionsgeschehen und bezüglich möglicher Impfreihenfolgen abzuleiten.