Imagico.de

blog

Die Vollständigkeit der OpenStreetMap-Gewässerdaten

| Keine Kommentare

Bei meiner früheren Analyse zur Qualität der OpenStreetMap-Gewässerdaten lag genau wie bei der Küstenlinie ein zentrales Problem darin, dass sich ohne geeignete Referenzdaten global nur recht wenig über die Qualität und Vollständigkeit der Daten aussagen lässt. Man hat zwar, wenn man sich mit den Daten beschäftigt, einen gewissen Eindruck davon, wo Dinge fehlen oder ungenau sind. Für die Küstenlinien habe ich das auch mal in einer Liste zusammengefasst. Man weiß dabei jedoch nie, ob man nicht die größten Fehler vielleicht übersehen hat.

Vor kurzem hat Stephan Knauss einen interessanten Vergleich der Google- und OpenStreetMap-Daten vorgestellt, welcher Gewässer-Informationen mit einschließt. Hierauf aufbauend habe ich überlegt, dass natürlich der Vergleich mit einer gleichermaßen unvollständigen Datenquelle wie bei Google auch nur recht begrenzte Aussagen darüber erlaubt, wo Daten fehlen oder ungenau sind. Aber es gibt auch noch andere Datensätze für Gewässer, welche – obwohl natürlich nicht so detailliert wie in OSM oder Google – in der Datenqualität wesentlich einheitlicher sind. Ein solcher Datensatz ist die MODIS Land-Wasser-Maske, welche bei 250m Aufläsung eine globale Darstellung der Land-Wasser-Verteilung des Planeten enthält.

Ich nehme nun die beiden Datensätze, welche auf den ersten Blick bei niedriger Auflösung fast identisch erscheinen

und berechne deren Differenz, was zu einer Karte mit folgendem Inhalt führt:

  • Die Flächen, welche als Wasser in der MODIS Land-Wasser-Maske auftauchen, jedoch nicht als Wasser in OpenStreetMap erfasst sind. Dies sind potentiell in OSM fehlende Gewässer und werden in den folgenden Karten in blau dargestellt.
  • Die Flächen, welche als Wasser in OpenStreetMap erfasst sind, jedoch nicht als Wasser in der MODIS Land-Wasser-Maske auftauchen . Dies sind möglicherweise fälschlich in OSM als Wasser erfasste Flächen und werden im folgenden in rot/orange dargestellt.

Hier ein paar Beispiele davon aus verschiedenen Gegenden der Welt. Die Links führen zur vollständigen Karte.

Diese Informationen sind natürlich nicht immer sehr verlässlich. Außer der begrenzten Auflösung existieren die folgenden größeren Probleme:

  • Eine ganze Reihe von blau markierten Flächen fehlen nicht wirklich in OSM, sondern sind defekte Multipolygon-Geometrien. Bei blauen Gebieten, welche auch in der Hintergrundkarte sichtbar sind, handelt es sich meist um solche Fälle (welche natürlich repariert werden sollten).
  • Die Analyse berücksichtigt nicht Tags wie intermittent, weshalb eine ganze Reihe von rot makierten Flächen zumindest gelegentlich wasserbedeckt sind, jedoch – da sie meist trocken liegen – nicht in den Referenzdaten auftauchen.
  • Die Referenzdaten sind in Teilen veraltet und auch nicht immer verlässlich. Das gilt vor allem für Gletscher-Gebiete, welche oft fälschlicherweise als Wasserflächen auftauchen. Die meisten blauen Bereiche in Grönland sind zum Beispiel solche Fehler. Ich habe die Antarktis bereits aus der Analyse herausgenommen, da die OSM-Daten dort grundsätzlich genauer sind als die Referenz. In manchen Bereichen zeigen die Referenzdaten auch eine zu große Wasserflächen-Ausdehnung im Bereich von saisonal überfluteten Flussebenen.

Trotzdem kann diese Karte wie in den gezeigten Beispielen zu sehen helfen, Fehler und Ungenauigkeiten zu erkennen – oftmals einfacher, als dies durch einen visuellen Vergleich mit Satellitenbildern möglich ist, welcher oft in einer Suche nach der Nadel im Heuhaufen resultiert.

Zusätzliche hierzu habe ich eine neue Dichtekarte der Gewässer in OpenStreetMap berechent – ähnlich der Darstellungen von vor etwa einem Jahr. Die erste zeigt die Dichte der Wasserflächen-Daten in rot und die Dichte der Wasserlinien-Daten in blau:

Die zweite die Linien mit waterway=river in rot und mit waterway=stream in blau:

Hinterlassen Sie eine Antwort

Pflichtfelder sind mit * markiert.



Durch das Abschicken Ihres Kommentars stimmen Sie der Datenschutzrichtlinie zu und erlauben, dass die eingegebenen Informationen (mit Ausnahme der eMail-Adresse) in diesem Blog veröffentlicht werden.