Forschungsbericht 2011



FESA - Fehlereindämmende selbststabilisierende Algorithmen für große, infrastrukturlose, vernetzte Systeme

Institut: E-17
Projektleitung: Volker Turau
Stellvertretende Projektleitung: Volker Turau
Mitarbeiter/innen: Sven Köhler
Laufzeit: 01.09.2008 — 31.08.2011
Finanzierung:Deutsche Forschungsgemeinschaft (DFG)

Ziel dieses Vorhabens ist die Entwicklung einer Methodik zur Erhöhung der Fehlertoleranz großer infrastrukturloser Netze. Fehlertoleranz ist die Eigenschaft eines Systems, seine Funktionsweise auch dann aufrechtzuerhalten, wenn unvorhergesehene Ereignisse oder Fehler in Hard- oder Software auftreten. In großen, infrastrukturlosen Netzen kann dies nur durch dezentrale Verfahren, wie etwa Selbststabilisierung, erreicht werden. Ein Verfahren ist selbststabilisierend, wenn es aus sich heraus, also ohne äußeres Zutun, nach transienten Fehlern selbsttätig in einen korrekten Zustand zurückkehrt. Die Entwicklung selbststabilisierender Algorithmen verfolgte bisher das Ziel, die Zeitspanne vom Auftreten eines Fehlers bis zur Wiedererlangung eines korrekten Systemzustandes zu minimieren. Dabei wird in Kauf genommen, dass während der Übergangsphase ein beträchtlicher Teil des Netzes seinen Dienst nicht erbringen kann.

Das Projekt hat das Ziel, die Auswirkungen von transienten Fehlern nicht nur zeitlich sondern auch räumlich zu begrenzen, d.h. es wird eine Fehlereindämmung angestrebt. Es soll eine Methodik zum Entwurf selbststabilisierender Algorithmen entwickelt werden, bei denen nur Knoten in der unmittelbaren Umgebung des Fehlerverursachers in die Fehlerbehebung involviert sind. Dadurch kann der überwiegende Teil des Netzes auch während der Übergangsphase seinen Dienst erbringen. Angestrebt wird ein problemunabhängiges Verfahren, welches existierende selbststabilisierende Algorithmen so erweitert, dass die resultierenden Algorithmen fehlereindämmend sind. Dies hat den enormen Vorteil, dass bereits existierende Algorithmen zusätzlich die Eigenschaft der Fehlereindämmung erhalten. Primäres Anwendungsfeld sind Algorithmen für drahtlose Netze, wie etwa Sensornetze. Dazu werden die entsprechenden Randbedingungen wie asynchrones Modell, broadcast als Kommunikationsprimitive, unzuverlässige Kommunikation und beschränkte Ressourcen berücksichtigt.

Ziel dieses Vorhabens ist die Entwicklung einer Methodik zur Erhöhung der Fehlertoleranz großer infrastrukturloser Netze. Fehlertoleranz ist die Eigenschaft eines Systems, seine Funktionsweise auch dann aufrechtzuerhalten, wenn unvorhergesehene Ereignisse oder Fehler in Hard- oder Software auftreten. In großen, infrastrukturlosen Netzen kann dies nur durch dezentrale Verfahren, wie etwa Selbststabilisierung, erreicht werden. Ein Verfahren ist selbststabilisierend, wenn es aus sich heraus, also ohne äußeres Zutun, nach transienten Fehlern selbsttätig in einen korrekten Zustand zurückkehrt. Die Entwicklung selbststabilisierender Algorithmen verfolgte bisher das Ziel, die Zeitspanne vom Auftreten eines Fehlers bis zur Wiedererlangung eines korrekten Systemzustandes zu minimieren. Dabei wird in Kauf genommen, dass während der Übergangsphase ein beträchtlicher Teil des Netzes seinen Dienst nicht erbringen kann.

Das Projekt hat das Ziel, die Auswirkungen von transienten Fehlern nicht nur zeitlich sondern auch räumlich zu begrenzen, d.h. es wird eine Fehlereindämmung angestrebt. Es soll eine Methodik zum Entwurf selbststabilisierender Algorithmen entwickelt werden, bei denen nur Knoten in der unmittelbaren Umgebung des Fehlerverursachers in die Fehlerbehebung involviert sind. Dadurch kann der überwiegende Teil des Netzes auch während der Übergangsphase seinen Dienst erbringen. Angestrebt wird ein problemunabhängiges Verfahren, welches existierende selbststabilisierende Algorithmen so erweitert, dass die resultierenden Algorithmen fehlereindämmend sind. Dies hat den enormen Vorteil, dass bereits existierende Algorithmen zusätzlich die Eigenschaft der Fehlereindämmung erhalten. Primäres Anwendungsfeld sind Algorithmen für drahtlose Netze, wie etwa Sensornetze. Dazu werden die entsprechenden Randbedingungen wie asynchrones Modell, broadcast als Kommunikationsprimitive, unzuverlässige Kommunikation und beschränkte Ressourcen berücksichtigt.

Stichworte

  • Fehlereindämmung
  • Selbststabilisierung
  • Verteilte Algorithmen

Publikationen

  • Turau, Volker; Hauck, Bernd: A fault-containing self-stabilizing (3 - 2/(Delta+1))-approximation algorithm for vertex cover in anonymous networks Theoretical Computer Science, 412(33): S. 4361-4371, 4361-4371.
  • Köhler, Sven; Turau, Volker: A new Technique for proving Self-Stabilization under the Distributed Scheduler. In Proceedings of the 12th International Symposium on Stabilization, Safety, and Security of Distributed Systems (SSS'10), Jg. 6366 von Lecture Notes in Computer Science9 2010.
  • Turau, Volker: Fault-containing self-stabilization in asynchronous systems with constant fault-gap Distributed Computing, 25(3): S. 207-224, 2012.
  • Köhler, Sven; Turau, Volker: Fault-containing self-stabilization in asynchronous systems with constant fault-gap. In Proceedings of the 30th IEEE International Conference on Distributed Computing Systems (ICDCS'10), 6 2010.
  • Köhler, Sven; Turau, Volker; Mentges, Gerhard: Self-stabilizing local k-placement of replicas with minimal variance. In Proceedings of the 14th International Symposium on Stabilization, Safety, and Security of Distributed Systems (SSS'12), Jg. 7596 von Lecture Notes in Computer Science10 2012.
  • Köhler, Sven; Turau, Volker: Space-efficient fault-containment in dynamic networks. In Proceedings of the 13th International Symposium on Stabilization, Safety, and Security of Distributed Systems (SSS'11), Jg. 6976 von Lecture Notes in Computer Science10 2011.