05. Juni 2018

Geodatenanalyse global - Herleitung eines weltweiten Gewässernetzes für die Überflutungsmodellierung

Um die Basis für eine weltweite Überflutungsmodellierung zu schaffen, erhielt geo7 von einem global aktiven Konzern aus der Versicherungsbranche den Auftrag mit einer einheitlichen Methodik ein weltweites Gewässernetz zu generieren und daraus hydrologische Parameter abzuleiten.

Gewässernetze zählen zu den bekanntesten Geodatensätzen und werden bei zahlreichen Analysen und Modellen eingesetzt. Die Ausdehnung der bestehenden Gewässernetze ist meist beschränkt (typischerweise landesweit) und ihre Auflösung und Genauigkeit sind heterogen. geo7 generierte auf der Grundlage eines globalen Höhenmodells mit 30m Rasterzellweite ein weltweit verfügbares und vergleichbares Gewässernetz.

Geodatenanalyse: Eine Datenanalyse, bei welcher Input- und Outputdatensätze Geodaten sind.
Geodatenanalyse: Eine Datenanalyse, bei welcher Input- und Outputdatensätze Geodaten sind.

Herleitung eines weltweiten Gewässernetzes

Mittels bekannter Geoprocessing-Werkzeuge lassen sich geografische und zugehörige Daten verarbeiten und räumliche Daten auswerten. So lassen sich zum Beispiel Oberflächen eines Digitalen Terrainmodells (DTM) relativ einfach untersuchen und daraus potenzielle Gewässerläufe und deren Einzugsgebiete ableiten. Handelt es sich wie bei der von geo7 durchgeführten Berechnung des Gewässernetzes um ein weltweites Vorhaben, steigt die Komplexität des Vorgehens massiv. Es stellen sich einige thematische und technische Herausforderungen.

  • inhaltliche Herausforderungen:
    Im Bereich von Seen und Senken liegt die Qualität der mit gewöhnlichen Geoprocessing-Werkzeugen erzielten Resultate weit hinter den Ansprüchen von geo7. Beispielsweise sind Hochebenen hinter Schluchten im DTM nicht als Täler, sondern als Senken implementiert. Die Ausdehnung dieser Senken betrug in einigen Beispielen über hundert Quadratkilometer und die Tiefe mehrere hundert Meter. Die einfachste Lösung, die Senken vorgängig aufzufüllen, ist bei den hier auftretenden Dimensionen nicht praktikabel.
  • rechenintensive Geodatenanalyse:
    Das Volumen des Höhenmodells, welches als Basis für die Auswertung dient, liegt bei 2 TB (für die Analyse dekomprimiert). Die Rechenleistung der Auswertung übersteigt die Leistung eines durchschnittlichen Desktop-Computers deutlich.

Der Gewässerverlauf am Talboden

Für den Umgang mit Senken der oben genannten Dimensionen existiert keine Standardlösung. Es wurde daher ein Algorithmus entwickelt, welcher den plausibelsten Weg des Gewässers sucht. Die Lösung basiert auf einem Kostenraster, dessen Kosten abhängig sind von der Höhe und der Geländekrümmung (tiefere Kosten für tiefe Punkte mit konkaver Krümmung). Der Algorithmus ist auch bei grossen Senken rechenbar und liefert gute Resultate.

Technische Umsetzung

Der im Projekt gewählte Umgang mit der grossen Datenmenge, welcher auch bei anderen Analysen anwendbar ist, erfordert eine Aufteilung der Analyse in eine Sequenz von Teilschritten und eine geografische Aufteilung der Datenmenge in (u.U. überlappende) Pakete. Im Falle des aktuellen Projekts wurde eine Steuerungsapplikation entwickelt, welche die Anzahl von Parallel-Prozessen startete und kontrollierte. Mithilfe dieser Steuerung konnte ein Grossteil der Analyse auf einer leistungsstarken Maschine mit 20 Cores und ausreichend Speicherplatz gerechnet werden.

Bei der Berechnung der hydrologischen Parameter (für 1.5 Mio. Gewässerabschnitte) reichte die Infrastruktur allerdings nicht aus. Die Berechnungen mussten ausgelagert werden auf eine verteilte Recheninfrastruktur. In Zusammenarbeit mit dem Data Analysis and Processing Lab Daplab der Universität Fribourg und einer Umsetzung mit Hadoop/Spark konnte eine Reduktion der Berechnungsdauer um Faktor 20 erreicht werden.

Auszug aus den Resultaten: Das Gewässernetz Europas
Auszug aus den Resultaten: Das Gewässernetz Europas

Allgemeiner Umgang mit rechenintensiven Geodatenanalysen

Die Anforderungen an Geodatenanalysen hinsichtlich Datenmengen steigen kontinuierlich. Die beschriebene Gewässernetzausscheidung ist nur ein Beispiel für eine Analyse, für welche die Verarbeitung auf einer Einzelmaschine nicht mehr ausreicht. Essentiell ist es aus der Fülle von Optimierungsmöglichkeiten auf Soft- und Hardware-Ebene im richtigen Moment das richtige Hilfsmittel einzusetzen oder durch ein leistungsstärkeres zu ersetzen. geo7 berät Sie gerne bei der Frage nach dem richtigen Hilfsmittel zur Umsetzung von Datenanalysen und unterstützt Sie bei der Auswertung grosser Datensätze.