Imagico.de

blog

Innovation und Flexibilität im OpenStreetMap-Projekt

| Keine Kommentare

Was OpenStreetMap für viele besonders attraktiv macht ist, dass jeder alles in die OpenStretMap-Datenbank eintragen kann, solange es vor Ort beobachtbar und überprüfbar ist. Wenn man bei OpenStreetMap mitwirkt muss man also nicht irgendeiner thematischen Agenda beitreten, die bestimmten Interessen dient.

Interessanterweise ist dieses Prinzip, welches OpenStreetMap attraktiv macht, gleichzeitig auch ein wichtiger Grund, weshalb viele Kartographen und Geographen mit konventionellem Hintergrund dem Projekt eher kritisch gegenüber stehen, denn sie glauben, dass das nicht funktionieren kann und – wie im Folgenden auch sichtbar wird – liegen sie damit auch nicht völlig falsch. Ich werde hier einen kritischen Blick auf diese Prämisse der Offenheit im Projekt werfen und darauf, was dieses Prinzip in der Realität einschränkt.

Die Freiheit, beliebige Dinge zu erfassen

Man sagt ja gewöhnlich, dass Freiheit nur dann wirklich existiert, wenn sie auch tatsächlich genutzt wird, schauen wir also, ob die OSM-Mapper tatsächlich von der Möglichkeit Gebrauch machen, beliebige überprüfbare Dinge zu erfassen. Auf den ersten Blick scheint sich dies zu bestätigen. Laut taginfo gibt es mehr als 50000 Schlüssel und mehr als 70 Millionen verschiedene Schlüssel-Wert-Paare in der Datenbank und selbst wenn man die vielen individuellen Werte wie bei Namen und ähnlichem sowie Tippfehler und unsinnige Daten herausrechnet bleibt eine überwältigende Zahl von verschiedenen Dingen mit Bedeutung, welche in OpenStreetMap erfasst sind. Das ist jedoch nicht die gesamte Geschichte.

Die beliebtesten Attribute in OSM aus taginfo

Man muss die Sache auch von einer anderen Seite betrachten, nämlich was die große Masse der Daten in OpenStreetMap eigentlich repräsentiert. Schaut man wieder in taginfo, erkennt man, dass mehr als 85% der Linien in der OSM-Datenbank mit einem der folgenden 20 primären Attribute versehen sind:

building=yes
highway=residential
highway=service
building=house
highway=track
waterway=stream
highway=unclassified
natural=water
highway=footway
highway=tertiary
highway=path
building=residential
natural=wood
landuse=forest
landuse=residential
highway=secondary
landuse=grass
highway=primary
landuse=farmland
building=garage

(Mancher mag fragen warum ich hier auf die Linien geschaut habe und nicht auf die Punkte – das liegt daran dass die Situation bei den Punkten deutlich unübersichtlicher ist, die meisten von ihnen haben gar keine Attribute und die etwa 100 Millionen Punkte mit Attributen haben zur Hälfte ein ‘source’ oder ‘created_by’-Attribut. Hierdurch wird die Analyse deutlich schwieriger. Insgesamt handelt es sich bei der größten Gruppe von Punkten mit bedeutungsvollen Attributen um Address-Punkte mit addr:*-Attributen)

Es gibt einen alten Spruch, welcher besagt, dass das street in OpenStreetMap sehr irreführend ist, denn im Projekt geht es nicht primär um die Erfassung von Straßen. Dies scheint korrekt zu sein, OSM ist eher ein Open street/building/address Map.

Natürlich geben die erwähnten 85% nicht die tatsächliche Dominanz dieser Elemente in der Realität wieder. Das ist jedoch völlig selbstverständlich, denn die Leute erfassen ja wenn sie frei sind beliebige Dinge zu erfassen, nicht unvoreingenommen alles was sie sehen, sondern die Dinge, die für sie von Bedeutung sind, also die Gebäude in denen sie leben und arbeiten und die Straßen auf denen sie sich bewegen. Dennoch ist auch das noch nicht die ganze Wahrheit.

Was motiviert die Mapper

Wer bei OpenStreetMap Dinge erfasst ist nicht nur motiviert davon, was er oder sie als für sich selbst von Bedeutung erachtet, die Leute erfassen auch Dinge, um ihr Wissen mit anderen zu teilen. Und dieses Teilen passiert in erster Linie auf dem Weg über Kartendarstellungen. Ich konzentriere mich hier auf Karten obwohl es natürlich auch noch andere Anwendungen der OSM-Daten gibt – wie Navigation oder Geokodierung. Karten sind jedoch immer noch die bedeutendste Anwendung und die 20 oben genannten und viele weitere häufig verwendete Attribute werden ja auch in Karten dargestellt.

Karten – und das ist wohl bekannt und wird auch oft im OSM-Projekt diskutiert – haben einen großen Einfluss auf die innere Dynamik des Projektes. Meist wird dies in Zusammenhang mit dem OSM-Standardstil thematisiert. Dieser wird prominent auf der OSM-Webseite dargestellt und bildet für die meisten Aktiven im OSM-Projekt die primäre Darstellung des Datenbankinhalts. Die beiden wichtigsten Anknüpfpunkte, die mich zu diesem Betrag motiviert haben, sind dann auch in direktem Bezug zu dieser Kartendarstellung. Der erste war der Vorschlag von Andy Allan, dass neue Elemente bevor sie im Standardstil dargestellt werden können, zuerst in einer anderen OSM-Karte verwendet werden sollten. Der zweite ist, dass kürzlich endlich eine Änderung in der Erfassungspraxis in OSM von vor etwa 2.5 Jahren bezüglich der Erfassung des Antarktis-Eises ihren Weg in den Standardstil gefunden hat. Was daneben auch eine Rolle gespielt hat ist die kürzliche Diskussion zum Nutzen und zu ethischen Aspekten der Erfassung auf die Ferne in OpenStreetMap.

Keines dieser Ereignisse ist insgesamt von größerer Bedeutung, sie haben mir jedoch geholfen, die innere Dynamik des OSM-Projektes besser zu verstehen.

Das gemeinschaftliche Erfassen von Dingen im OpenStreetMap-Projekt und die Darstellung in OSM-basierenden Karten bilden so etwas wie einen Regelkreis. Dieses Bild wird oft vor allem in Bezug auf den Standardstil verwendet, jedoch sind viele populäre OSM-Kartenstile bemerkenswert ähnlich hinsichtlich der Daten, die sie darstellen, wie sie diese darstellen und bei welchen Zoomstufen. Natürlich gibt es auch spezielle Karten und transparente Zusatzebenen für Karten, die Basiskarten stellen jedoch das Gros der Daten dar (die 85 Prozent plus weitere mindesten 10 Prozent der häufigsten Daten) und sind alles in allem einander sehr ähnlich. Man kann den Standardstil als so etwas wie einen Rahmenstil für die anderen allgemeinen OSM-Kartenstile auffassen – nur sehr wenige Dinge werden in beliebten OSM-Karten dargestellt, welche nicht auch im Standardstil zu sehen sind. Vor diesem Hintergrund ist der Vorschlag von Andy recht einleuchtend – hierdurch würde vermieden, dass dieser Stil sich zu weit vom Rest der der Welt der OSM-Karten entfernt.

Mapper verwenden die Kartendarstellungen um ihre Arbeit zu überprüfen und sie stimmen ihre Prioritäten und die verwendeten Attribute auf die Karten ab. Die Kartengestalter wiederum passen ihre Kartenstile an, so dass sie besser wiedergeben, was die Leute erfassen. In den meisten Fällen klappt dieses Zusammenspiel recht gut und theoretisch erlaubt es auch, flexibel auf Änderungen bei den Prioritäten und der Art und Weise, wie Dinge erfasst werden, einzugehen. Es gibt jedoch ein echtes Risiko, dass dieser Regelkreis zu einem geschlossenen System mit nur noch wenig Bezug zur Realität wird, nämlich wenn eine der beiden Seiten (Mapper oder Kartengestalter) mehr auf die jeweils andere Seite achtet, als auf die Realität, die die Karte am Ende darstellen soll. Das blöde daran ist, dass der beschriebene Regelkreis nur funktioniert, wenn Mapper und Kartengestalter ihre Arbeit aufeinander abstimmen, obwohl es im Grunde fast besser wäre, wenn sie einander ignorieren würden.

Direkt mit diesem Problem verbunden ist ein anderes, welches ich das Dilemma der gemeinschaftlichen Kartenerfassung nenne: Mapper sind gewöhnlich motiviert von der Idee ihr Wissen über die Welt zu teilen und so auch vom Wissen anderer zu lernen. Wenn jedoch jeder Mapper die selben Interessen hat und sich auf die selben Dinge konzentriert, dann lernt niemand wirklich etwas Neues. Die beiden beschrieben Mechanismen zusammen bewirken vermutlich, das es in der Dynamik des OpenStreetMap-Projektes theoretisch ein stabiles Gleichgewicht gäbe, wo die OSM-Gemeinschaft aus Leuten mit sehr begrenzten Interessen besteht (man denke an die 20 Attribute oben plus vielleicht 50 weitere primäre Attribute und um die hundert Zusatzattribute) und Kartengestalter darum konkurrieren, die ansprechendste Darstellung dieses überschaubaren Datensatzes zu erzeugen. Dieses Szenario liegt deutlich näher an dem, was in der traditionellen Kartographie üblich ist – nur dass dort die Auswahl der Elemente systematisch am Anfang festgelegt wird, während sie hier das Ergebnis einer konvergierenden evolutionären Entwicklung wäre.

Ich behaupte nicht, dass sich die OSM-Gemeinschaft bereits an diesem Punkt befindet, denke jedoch, dass die Gefahr für eine solche Entwicklung durchaus besteht. Das skizzierte Szenario ist nämlich für viele, sowohl innerhalb des OSM-Projektes als auch außerhalb bei reinen Datennutzern, nicht unattraktiv. Die Mapper wären übrigens dabei im Prinzip weiterhin frei, beliebige Dinge zu erfassen, die Chancen, dass ihre Arbeit dann in einer Karte von breiterer Bedeutung auftaucht, wären jedoch gering. Dies wäre nur möglich, wenn es sich um Informationen von sehr breitem Interesse handelt, welche auch bei vielen weiteren Mappern beliebt sind. Mit weiterer Entwicklung des OSM-Projektes würde dies zunehmend unwahrscheinlicher.

Die Freiheit erhalten

Konkrete Vorschläge um eine solche Entwicklung zu vermeiden sind schwierig, jedoch ist allein das Bewusstsein für dieses Risiko sicher von großem Nutzen. Es gibt allerdings zwei konkrete Maßnahmen, die ich für wichtig hielte:

  • Mehr Vielfalt bei Kartendarstellungen: Ich habe bereits dargelegt, dass derzeit existierende Karten sehr einheitlich sind – nicht in ihrem oberflächlichen Erscheinungsbild, jedoch in den zugrunde liegenden Regeln und Entscheidungen. Es wäre gut, diese Homogenität stärker aufzubrechen und mehr Karten zu etablieren, die die OSM-Daten von einer deutlich anderen Perspektive zeigen. Es gibt einzelne Beispiele von lokalen Kartenprojekten, die sich in eine solche Richtung bewegen, zum Beispiel die topographische Karte von maxbe, welche recht prominent Gebiete mit den Attributen place=region + region:type=mountain_area darstellt und Berggipfel und Sattelpunkte für eine bessere Darstellung vorverarbeitet. Ich rede hier nicht von speziellen Zusatzebenen für Karten zur Hervorhebung von POIs und Routen – auch diese sind wichtig, jedoch gibt es so was schon in recht großer Auswahl für verschiedenste Zwecke. Was ich meine sind neue innovative Basiskarten, die neue Daten aus OSM integrieren, welche derzeit nicht in anderen Karten verwendet werden und welche neue Wege bei der Interpretation der umfangreichen Daten aus der Liste oben gehen. Die konservativen Basiskarten, die wir haben, sind alle mit einem recht engen kulturellen Hintergrund entwickelt und es wäre wirklich erfrischend, mehr Alternativen zu sehen, welche die Welt auch aus deutlich anderen kulturellen Blickwinkeln darstellen.

    Neue Ansätze für die Basiskarten-Gestaltung bei der topographischen Karte von maxbe

    Was mich dabei besonders schmerzt zu sehen ist, dass keine der größeren Firmen, die mit OSM-Daten arbeiten, anscheinend in dieser Richtung aktiv sind. Sie sprechen die Bedürfnisse der großen und homogenen Märkte Mitteleuropas und Nordamerikas auf kurze Sicht sicherlich recht erfolgreich an, in Hinblick auf Kartengestaltung sehe ich dort jenseits der rein technischen Ebene so gut wie keine Ansätze in Richtung strategischer Forschung und Entwicklung. Wenn überhaupt kommen innovative Entwicklungen hier eher von Einzelpersonen oder kleinen Firmen.

  • Etablierung einer Zwischenebene zwischen Erfassung und Darstellung: Viele denken jetzt vermutlich an Vektor-Kacheln, das ist jedoch nicht was ich hier meine. Vektor-Kacheln sind eine technische Zwischenebene um die Datenverarbeitung effizienter zu gestalten. Was ich meine ist eine semantische Zwischenebene, welche eine umfangreichere Neuinterpretation der erfassten Informationen ermöglicht im Vergleich zu dem, was im Rahmen von Kartenstilen heute schon möglich ist und gemacht wird. Weiter oben habe ich über die Freiheit geschrieben, alles zu erfassen. Diese Freiheit gilt im Allgemeinen für die Erfassung neuer Dinge, welche nicht zuvor von anderen schon erfasst wurden. Für bereits anderswo erfasste Dinge wird vom Mapper generell erwartet, das er oder sie die existierenden Attribute verwendet. Das Problem ist jedoch, dass dies für eine differenzierte Erfassung oft nicht gut funktioniert. Man nehme zum Beispiel die verschiedenen Landnutzungen und Landbedeckungen – die hierfür in OSM etablierten Attribute sind von einer europäischen, oft sogar noch spezieller britischen Perspektive entwickelt worden. Obwohl man vermutlich auch die Landnutzung im Nahen Osten oder in Zentralasien entsprechend diesem Schema irgendwie erfassen kann, ist dies oft sehr wenig intuitiv für die Leute vor Ort und führt oft zu merkwürdigen Ergebnissen.

    Wenn die üblichen Schubladen nicht passen. wood? scrub? bare_rock?

    Um die Realität in der OSM-Datenbank möglichst korrekt und für den Mapper bequem abzubilden, würde es Sinn machen, den Mappern zu erlauben, Landnutzung und Landbedeckung so aufzuteilen, wie es ihnen richtig erscheint und nicht mit einem System zu arbeiten, welches Leute weit weg in Europa entwickelt haben. Derzeit ist dies jedoch nicht üblich, da es sowohl direkten Druck von anderen Mappern gibt, die existierenden Attribute zu verwenden als auch indirekten Druck, da nur so die Arbeit in den Karten sichtbar wird. Eine Zwischenebene würde die Beziehungen zwischen den verschiedenen lokalen Erfassungsarten herstellen und den Kartengestaltern erlauben, verschiedene Attribute aufgrund solcher Beziehungen gemeinsam darzustellen – dies jedoch auf Einzelfall-Basis und nicht wie derzeit erzwungenermaßen bereits bei der Erfassung. Die Regeln für diese Zwischenebene könnten gut von der OSM-Gemeinschaft geschrieben und weiterentwickelt werden, denn hierfür sind weniger Fachwissen und spezielle Erfahrungen notwendig als für die Kartengestaltung selbst.

    Viele sagen jetzt vermutlich dass dies nicht funktionieren wird, denn ein universelles, einheitliches Attribut-System ist der Schlüssel für ein funktionierendes OSM-Projekt. Ich weise dies auch keineswegs kategorisch zurück – allgemeingültige Attribute haben große Vorteile. Es besteht jedoch denke ich kaum Zweifel daran, dass es unter den 100 häufigsten OSM-Attributen viele gibt, bei denen es keine global einheitliche Bedeutung gibt. Für Straßen und administrative Grenzen ist dies zum Beispiel allgemein anerkannt und es gibt auch andere Seiten im Wiki, die lokale Unterschiede bei den Attributen dokumentieren – jedoch wird dies derzeit so weit ich weiß nicht in Karten für eine differenziertere Darstellung verwendet.

    Natürlich ist die Neuinterpretation von Attributen nur eine mögliche Aufgabe einer solchen Zwischenebene. Es gibt auch Unterschiede, wie Dinge geometrisch erfasst werden, zum Beispiel wenn Dinge entweder als Polygon oder als Linie repräsentiert werden. Beides zu kombinieren funktioniert in den derzeitigen Karten meist nicht gut und auch hier könnte eine Zwischenebene eine Vereinheitlichung vornehmen – wenngleich eine umfangreichere Geometrieverarbeitung natürlich mehr Probleme mit dem Rechenaufwand mit sich bringt als einfache Attribut-Interpretationen.

Hinterlassen Sie eine Antwort

Pflichtfelder sind mit * markiert.

*

CAPTCHA

*