The Information Bottleneck Method in the Corona Pandemic

Currently, research at the Institute of Communications is also severely impacted by the current Corona measures. Typically, staff members conduct research on advanced transmission technologies in the area of 5G, algorithms for localization, and the use of machine learning to design future communication systems.

A particular emphasis is on methods from applied information theory. Information theory allows quantifying the information content of messages mathematically. It enables to compress the information so that only the relevant information is retained or to insert redundancy to additionally protect a particularly important message. This approach is called source coding or channel coding. At the Institute of Communications, an elegant tool from the field of machine learning, the so-called "Information Bottleneck Method" is used to design efficient signal processing algorithms and, for example, to reduce the energy consumption and latency of mobile devices.

However, the methods employed also allow application in generic problems and general applications in the area of Big Data. As part of his project work, Semir Cömertpay and his supervisor Maximilian Stark dealt with the use of the information bottleneck method to combat the Covid19 pandemic. A particular focus was on the identification of vulnerable population groups that are particularly at risk. Based on raw data from the Robert Koch Institute (RKI), the Corona pandemic was examined using information theory, and novel partitions of the society into risk groups based on the age profile and gender were identified. Figure 1 shows the population's optimal classification thus found for different gradations, that is, for different numbers of groups. Simultaneously, the ratio of the obtained information related to the risk of population groups (determined by the mortality rate due to infection) is shown. It turns out that from the point of view of information theory, consideration of 6 groups would be optimal. It is also interesting to note that in addition to age, gender is of particular importance for people older than 80 years.

Providing more profound insights into the available data, methods that we usually use for entirely different questions can thus be used to derive possible protection concepts as well as findings on the occurrence of infections and on possible vaccination plans.

 

Die Information-Bottleneck-Methode in der Corona Pandemie

Auch die Forschung am Institut für Nachrichtentechnik unter der Leitung von Prof. Gerhard Bauch wird durch die aktuellen Corona Maßnahmen stark beeinträchtigt. Normalweise forschen die Mitarbeiter zu modernen Übertragungstechnologien im Bereich 5G, Algorithmen zur Lokalisierung sowie dem Einsatz von Machine Learning zum Entwurf zukünftiger Kommunikationssysteme.

Ein besonderer Fokus liegt hierbei auf Methoden der angewandten Informationstheorie. Die Informationstheorie erlaubt es den Informationsgehalt von Nachrichten mathematisch zu quantifizieren. Dadurch ist es möglich Information zu komprimieren sodass nur die relevante Information erhalten bliebt oder aber Redundanz einzufügen, um eine besonders wichtige Nachricht zusätzlich zu schützen. Man spricht hierbei von Quellencodierung bzw. Kanalcodierung. Am Institut für Nachrichtentechnik wird ein besonderes Tool aus dem Bereich des maschinellen Lernens, die sog. „Information Bottleneck Methode“ besonders eingesetzt um effiziente Signalverarbeitungsalgorithmen zu entwerfen und zum Beispiel den Energieverbrauch sowie die Latenz mobiler Endgeräte zu reduzieren.

Allerdings erlauben die verwendeten Methoden auch den Einsatz in generischen Fragestellungen und allgemeinen Anwendungen im Bereich Big Data. Im Rahmen seiner Projektarbeit beschäftigte sich Semir Cömertpay zusammen mit seinem Betreuer Maximilian Stark mit dem Einsatz der Information Bottleneck Methode zur Bekämpfung der Covid19 Pandemie. Ein besonderer Fokus lag hierbei auf der Identifikation von besonders gefährdeten, vulnerablen Bevölkerungsgruppen. Basierend auf Rohdaten des RKI wurde die Entwicklung der Corona Pandemie informationstheoretisch untersucht und neuartige Unterteilungen in Risikogruppen anhand des Altersprofils und Geschlechts ermittelt. Abbildung 1 zeigt die so gefundene optimale Einteilung der Bevölkerung für verschiedene Abstufungen, das heißt für verschiedene Anzahlen von Gruppen. Gleichzeitig wird das Verhältnis der erhaltenen Information bezogen auf die Gefährdung von Bevölkerungsgruppen (bestimmt durch die Sterberate infolge einer Infektion) angezeigt. Es zeigt sich, dass aus informationstheoretischer Sicht eine Betrachtung von 6 Gruppen optimal wäre. Interessant ist zusätzlich, dass besonders zusätzlich zum Alter bei über 80 Jährigen das Geschlecht von besonderer Bedeutung ist.

Methoden, die wir üblicherweise für völlig andere Fragestellungen einsetzen, können also genutzt werden, um durch tiefere Einblicke in die vorhandenen Daten mögliche Schutzkonzepte sowie Erkenntnisse zum Infektionsgeschehen und bezüglich möglicher Impfreihenfolgen abzuleiten.