Imagico.de

blog

OpenStreetMap von der schlechten Seite

| Keine Kommentare

Um es gleich zu Anfang zu sagen: dieser Beitrag dreht sich nicht um Datenqualität – worüber ich hier schreiben möchte sind die Mechanismen, nach denen OpenStreetMap funktioniert und wie diese Prinzipien machmal versagen.

Kurz zusammengefasst – bei OpenStreetMap kann jeder mit beitragen, an den Daten arbeiten und dadurch etwas wertvolles produzieren, was andere dann verwenden können, in Karten und anderen Anwendungen, die OSM-Daten nutzen. Der eigentliche Schlüssel für das Funktionieren ist jedoch, dass wenn man am Projekt mitarbeitet, andere die im selben Gebiet arbeiten auf diesen Beiträgen aufbauen können, sie mit zusätzlichen Details ergänzen, Informationen aktualisieren und Ungenauigkeiten korrigieren. Dies macht OSM für Beitragenden attraktiv – man weiss, dass die Arbeit von Nutzen ist, die man investiert, oft auch viele Jahre später denn darauf folgende Bearbeitungen werden durch die hierdurch geschaffene Basis unterstützt. Und dieser Mechanismus ist auch attraktiv für die Datennutzer, denn das Ergebnis wird hierdurch deutlich wertvoller als die Summe der einzelnen Beiträge zusammen.

Wer mich kennt wird vielleicht schon erkennen dass ich, wenn ich über das Versagen dieses Prinzips spreche, Kanada im Kopf habe, insbesondere den Norden des Landes, ein Gebiet, welches die meisten vielleicht am Besten durch das verzerrte Erscheinungsbild in der Mercator-Projektion erkennen:

Die kanadische Arktis in OpenStreetMap

Diese Region ist einer der am dünnsten besiedelten Teile der nördlichen Hemisphere – Nunavut und die Northwest Territories haben zusammen eine Einwohnerzahl von weniger als 100000 und der größte Teil davon lebt südlich des hier betrachteten Ausschnitts, welcher vermutlich weniger als 10000 Einwohner hat.

Dadurch ist dies eine recht schwierige Region für OpenStreetMap. Hier ist mal dargestellt wie dieses Gebiet hinsichtlich der Datendichte in OSM aussieht – in einer anderen, weniger verzerrenden Projektion:

Ich habe hierfür die Daten in drei Kategorieren aufgeteilt:

  • Alte Importe von Küstenlinien und größeren Gewässern, größtenteils PGS, von vor etwa 8 Jahren und seit dem nicht mehr verändert, sind in blau gezeigt – insgesamt etwa 1.3 Millionen Punkte.
  • Nicht nachträglich veränderte Canvec-Importe sind in rot gezeigt – etwa 5.2 Millionen Punkte.
  • Der Rest, also per Hand erfasste Dinge und alle Punkte, die nachträglich verändert wurden – etwa fünfhundert tausend Punkte.

Wenn man jetzt das Rot ignoriert kann man den Eindruck bekommen, dass das eigentlich für so eine entlegene Region ganz gesund aussieht. Schaut man auf das Alter der Daten:

sieht man, dass die meisten manuellen Bearbeitungen recht jung sind und auf kleinere Gebiete beschränkt. Die Canvec-Daten sind hier in grau dargestellt, denn das Daten-Alter und das Alter der Punkte in OSM sind natürlich nicht identisch – zum größten Teil wurden die Importe in den letzten fünf Jahren durchgeführt. Das Ganze lässt sich natürlich nicht mit einem dicht besiedelten Gebiet in Europa vergleichen, es gibt so gut wie keine Erfassung vor Ort am Boden, weder in den importierten Daten noch im per Hand erfassten, alles basiert auf Erfassung auf die Ferne. Aber zum Vergleich hier die selbe Darstellung von Grönland – ein Gebiet, welches recht gut vergleichbar ist hinsichtlich Bevölkerungszahl, Zugänglichkeit und Geographie:

Vergrößert weisen die beiden Karten übrigens den selben Maßstab auf. Im Vergleich zum Norden Kanadas gibt es in Grönland schon deutlich frühere und umfangreichere Erfassungen per Hand. Es gibt auch alte Küstenlinien-Importe wie in Kanada, insbesondere an der Westküste. Insgesamt ist das Datenvolumen recht ähnlich, wenn man die Canvec-Importe ignoriert, Grönland sind etwa 2 Millionen Knoten insgesamt, alte Importe und manuelle Bearbeitungen zusammen sind in Kanada etwa 1.8 Millionen Punkte.

Was also bewirkt den Unterschied? Die recht naheliegende Erklärung sind die Canvec-Importe. Außer den alten Küstenlinien-Importen gibt es in Grönland keine importierten Daten. Schaut man sich die Karten oben und die Daten an erkennt man, dass die Bearbeitung per Hand die alten Importe recht frei ergänzt und ersetzt, während es kaum Wechselwirkung zwischen den Canvec-Importen und den manuellen Bearbeitungen gibt. Etwa 200k der 500k per Hand bearbeiteten Punkte sind nach der urprünglichen Erstellung bearbeitet worden (also Version >=2), das meiste davon sind per Hand verfeinerte Küstenlinien. Deutlich weniger als ein Prozent der Canvec-Punkte sind hinterher noch bearbeitet worden, und die meisten Bearbeitungen in Canvec-Import-Gebieten sind einfache mechanische Aufräum-Arbeiten. Wer jemals versucht hat in einem Gebiet mit Canvec-Daten per Hand zu editieren weiss, warum dies selten passiert – ich hab das mal im äußersten Norden gemacht und das ist wirklich nichts, was man gerne tut. Die Canvec-Importe sind also gewissermaßen Fremdkörper in der Karte für die normale Bearbeitung, welche weitgehend um diese herum geschieht.

Man erinnere sich daran, was ich über die Funktionsweise von OpenStreetMap oben geschrieben habe und wie Beiträge die Basis und Unterstützung für darauf folgende weitere Beiträge bilden. Für die Canvec-Importe gilt das nicht, insbesondere nicht in der Arktis. Auch anders herum funktioniert dies nicht, also indem die Importe bestehende manuelle Erfassungen integrieren. Wenn überhaupt begraben solche Importe die vorherige Handarbeit unter Tonnen von Daten von fragwürdiger Qualität. Und die Aussicht darauf, dass dies passiert ist nicht gerade verlockend für potentielle Mapper, insbesondere wenn man alternativ auch die Möglichkeit hat, ein paar hundert Kilometer weiter östlich ohne solche Probleme zu arbeiten.

Nun hab ich zu Anfang geschrieben, dass es hier nicht um Datenqualität geht, ich möchte jedoch auf ein zentrales Argument von Befürwortern von Canvec-Importen eingehen: dass die Qualität der Canvec-Daten gut ist und besser als was man per Hand aus verfügbaren Quellen erfassen kann. Dies stimmt nicht. Canvec-Daten in dem hier betrachteten Gebiet sind größtenteils etwas detaillierter als dies aus verfügbaren Quellen erfassbar wäre, jedoch deutlich schlechter in Hinblick auf so gut wie alle sonstigen Kriterien:

  • sie sind weniger aktuell, was insbesondere in der Arktis durch Gletscher-Rückgang und Klimawandel von großer Bedeutung ist, in den meisten Fällen sind die Canvec-Quelldaten in diesem Gebiet wenigsten zehn Jahre alt, manche Teile jedoch auch noch deutlich älter (wie 1980er Jahre).
  • sie sind oft faktisch falsch, teils durch falsche urprüngliche Erfassung, teils durch falsche Konvertierung der Attribute.

Jedem der das nicht glaubt empfehle ich einen Blick auf die jüngsten Bilder aus den OSM images for mapping in diesem Bereich und den Vergleich mit den Canvec-Daten.

Durch diese Probleme bilden die importierten Daten noch nicht einmal einen nützlichen Hinweis für Mapper für die Erfassung in einem Gebiet mit dem sie nicht vertraut sind – im Gegenteil kommuniziert dies in vielen Fällen eine inkorrekte Erfassungs-Praxis.

Ein weiteres oft vorgebrachtes Argument ist, dass zusätzliche Daten in der OSM-Datenbank ein Vorteil an sich sind. In der Realität ist dies kaum der Fall – wenn Datennutzer die Canvec-Daten nützlich finden ist es meist deutlich einfacher, diese direkt von der Quelle zu beziehen, wo sie vollständig und in einheitlicher Qualität und mit allen ursprünglichen Attributen verfügbar sind. Und wenn man Daten in diesem Umfang nutzt fällt der kleine mögliche Vorteil sie im gewohnten OSM-Format zu haben meist nicht sonderlich ins Gewicht.

Um es kurz zu machen – der einzige Weg, wie die kanadische OSM-Community auf lange Sicht gesehen den Norden Kanadas zu einem wertvollen Teil der OSM-Datenbank machen kann und zu einem Gebiet, wo es lohnenswert erscheint sich als Mapper zu betätigen wäre es, die Canvec-Importe hier zu beenden und die zuvor importierten Daten wieder zu entfernen. Ansonsten dürfte der Norden Kanadas weiter hinter dem Rest der Welt zurückfallen was den Aufbau einer aktiven Community betrifft genau wie hinsichtlich Nützlichkeit der Daten – nicht trotz der Importe, sondern gerade wegen der Importe.

Manche lesen hier vermutlich hinein, dass ich generell gegen Datenimporte in OSM bin, was jedoch nicht der Fall ist – die Schlüsselfrage bei Importen ist jedoch, ob diese weiter Bearbeitungen im Gebiet des Imports unterstützen oder nicht und in diesem Fall ist die Antwort ziemlich sicher nein.

Was ich mich in Bezug auf dieses Thema übrigens frage ist, ob es hier eine tiefere kulturelle Differenz zwischen Europa und Amerika gibt, zwischen alter und neuer Welt. Da ich aus Europa stamme bin ich in Bezug auf diese Frage vermutlich nicht neutral – trotz umfangreicher Erfahrungen bei der Datenerfassung in der Arktis. Es ist möglich, dass das, was ich über Motivation und Anreize bei Mappern geschrieben habe zwar für den durchschnittlichen europäischen Mapper gilt, für jemanden aus Nordamerika jedoch weniger. Da ein Großteil der manuellen Bearbeitungen in der kanadischen Arktis durch Leute von anderswo auf der Welt stattfindet könnte so etwas selbst bei einem neutralen Beobachter zu einer verzerrten Wahrnehmung führen. OpenStreetMap fußt auf dem Primat der lokalen Mapper – diese entscheiden wie Dinge in ihrem Gebiet erfasst werden und ob Daten importiert werden. Aber es stellt sich natürlich die Frage, ob jemand der in Toronto, Montreal oder Vancouver sitzt, wirklich eher ein lokaler Mapper auf Devon Island oder Ellesmere Island ist als ein Brite, Deutscher oder Russe?

Hinterlassen Sie eine Antwort

Pflichtfelder sind mit * markiert.



Durch das Abschicken Ihres Kommentars stimmen Sie der Datenschutzrichtlinie zu und erlauben, dass die eingegebenen Informationen (mit Ausnahme der eMail-Adresse) in diesem Blog veröffentlicht werden.