Imagico.de

blog

nobuiltup
nobuiltup

Wo OpenStreetMap schlecht ist

| 2 Kommentare

Bei der Verarbeitung der Gebäude- und Straßen-Daten für die generalisierten Umrisse menschlicher Siedlungen kam mir die Idee, dass sich diese Daten auch für andere interessante Dinge verwenden lassen. Zum Beispiel lässt sich hieraus recht einfach ermitteln, welche Teile des Planeten sich in einem gewissen Abstand zu Straßen und Gebäuden befinden. Die folgende Karte zeigt in rot alle diejenigen Landflächen, welche nach den OpenStreetMap-Daten mehr als 10 Kilometer von einer Straße oder einem Gebäude entfernt sind.

Natürlich sind die Gebäude- und Straßen-Daten aus OpenStreetMap alles andere als vollständig, die rot markierten Bereiche sind also nicht alle weit von wirklichen Straßen und Gebäuden entfernt, sondern nur soweit diese in OSM erfasst sind.

Das Interessante dabei ist jedoch, dass dies ein ganz guter Maßstab dafür ist, wo OpenStreetMap schlecht ist. Nicht wirklich schlecht in Bezug auf die tatsächliche Qualität der Daten, diese variiert enorm in den roten Bereichen, sondern schlecht dahingehend, dass die Funktionsprinzipien, nach denen OpenStreetMap arbeitet, hier nur sehr unzureichend funktionieren. Der wichtigste Weg der Datenerfassung in OpenStreetMap ist durch Leute, die Elemente ihrer unmittelbaren Umgebung erfassen. Da dies Informationen aus erster Hand sind und die an dieser Arbeit beteiligten Menschen sich gegenseitig überprüfen und ergänzen, indem sie die Daten mit ihrer eigenen Beobachtung vergleichen, sind die resultierenden Daten meist recht aktuell und von guter Qualität – wie unzählige Vergleiche mit konventionellen Karten ja auch zeigen. Dieser Mechanismus versagt jedoch in Gegenden, wo nur wenige oder keine Leute leben und auf Basis von direkten Beobachtungen mappen. Dies sind entweder schwer zugängliche, also wirklich entlegene Gebiete oder Gegenden, die zu besuchen und für OSM zu erfassen nur wenig Interesse besteht und die deshalb nicht gut erfasst sind. Die oben rot markierten Bereiche stellen eine Mischung von beidem dar.

Nur sehr kleine Teile der OSM-Daten in diesen Bereichen gehen auf klassische Erfassung vor Ort zurück, die wichtigsten Methoden wie Daten in OSM hier erfasst werden sind:

Wie gut die Daten in diesen Gebieten sind hängt davon ab, wie gut diese beiden Methoden genutzt werden. Das Hauptproblem dabei ist, dass es im Gegensatz zur klassischen Erfassung vor Ort hier keine etablierten und funktionierenden Mechanismen der Qualitätskontrolle und Überprüfung der Daten gibt. Die Qualität der Daten hängt deshalb sehr davon ab, wie gewissenhaft die Erfassung oder der Import der Daten erfolgt und dies hängt leider stark von der Arbeit der einzelnen Mapper ab. Das bedeutet natürlich nicht, dass es anderswo auf der Welt keine Qualitätsprobleme aufgrund schlechter Erfassung gibt, dort ist es jedoch deutlich unwahrscheinlicher, dass sich solche Fehler über längere Zeit halten, als in entlegenen Gebieten.

Der Ansatz diese Situation zu verbessern liegt natürlich darin, mehr Leute dazu zu bringen, an diesen Gegenden zu arbeiten. Damit dies jedoch analog zur den weniger abgelegenen Bereichen einen positiven Einfluss auf die Datenqualität hat, ist es von entscheidender Bedeutung, dass die beteiligten Leute eine Vielzahl unterschiedlicher Datenquellen verwenden. Wenn hundert Mapper in einem Gebiet auf Basis der selben Luftbilder Dinge erfassen, interpretieren sie diese Bilder üblicherweise sehr ähnlich – einschließlich der Fehlinterpretationen. Der Schlüssel zu hochwertigen Daten ohne Beobachtungen aus erster Hand aus der Nähe liegt in der Nutzung möglichst vieler unabhängiger Datenquellen.

2 Kommentare

  1. Wobei natürlich auch klar ist, dass in den Gebieten, wo weit und breit keine Leute wohnen, oft auch nicht viel da ist, das gemappt werden kann. 10 km ist in der Sahara nicht viel, und auch in der Antarktis oder z.B. Grönland ist da nicht so viel von dem, was wir in OSM typischerweise erfassen (Geländereliefs etc. kommen ja üblicherweise aus Rasterdaten). Und: nicht nur ist da nicht viel, es interessiert auch kaum jemandem im Detail.

    Trotzdem, interessante Karte :)

    • Ich hab mich ja hier ganz bewusst nicht auf die tatsächliche Dichte der Daten bezogen, da dabei wirklich kaum zwischen unterschiedlicher Erfassugsdichte und unterschiedlicher Dichte des Erfassbaren unterschieden werden kann. Wobei man aber natürlich auch bedenken muss, dass auch die schlechte Erreichbarkeit von Gegenden und das geringe Interesse an diesen eng miteinander gekoppelt sind, geringes Interesse bewirkt schlechte Erreichbarkeit und gleichzeitig beeinflusst die Erreichbarkeit stark das Interesse.

      Grundsätzlich gibt es aber in fast allen der rot markierten Bereiche enorm viele Dinge, die nach OSM-Standards erfassungswürdig wären, die also anderswo oft routinemäßig erfasst werden. Ich würde mal grob schätzen, dass wenn man die rot markierten Gebiete alle auf dem durchschnittlichen Niveau des Rests der Erde erfassen würde (wohlgemerkt Durchschnitt, also nicht die Vollständigkeit, die wir zum Beispiel in Deutschland haben) sich die Datenmenge in der OSM-Datenbank um 30-50 Prozent vergrößern würde.

Hinterlassen Sie eine Antwort

Pflichtfelder sind mit * markiert.

*

CAPTCHA

*



Durch das Abschicken Ihres Kommentars stimmen Sie der Datenschutzrichtlinie zu und erlauben, dass die eingegebenen Informationen (mit Ausnahme der eMail-Adresse) in diesem Blog veröffentlicht werden.