OSM: Datenqualität von OpenStreetMap-Daten unter der Lupe: Informationen zu Nachtclubs am Beispiel von vier bayerischen Städten
Bei OpenStreetMap (OSM) handelt es sich um ein Projekt, welches unter einer offenen Lizenz frei nutzbare Geodaten sammelt. Durch diese Daten können digitale Karten erzeugt und der Allgemeinheit zur Verfügung gestellt werden. Das OpenStreetMap-Prinzip gleicht dem vom Wikipedia: Daten können von Benutzer*innen verändert werden. Diese Änderungen können wiederum von anderen Benutzer*innen rückgängig gemacht werden. Grundlage für die mit OSM erstellten Karten sind geografische Daten, welche von jedem auf verschiedene Art und Weisen erfasst werden können, z.B. durch Lokalwissen. Um Daten in OSM zu bearbeiten, werden von den Kartenersteller*innen (den sogenannten Mapper*innen) verschiedene Bearbeitungsprogramme genutzt, wie beispielsweise Online-Editoren (z.B. JOSM) oder Apps. Werden von den Mapper*innen Daten gesammelt, lassen sich diese nach unterschiedlichen Kartendatenelementen unterscheiden: Knoten/Punkte markieren einen bestimmten Ort. Linien stellen die Verbindung zwischen den Punkten dar (z.B. eine Straße). Bei Flächen handelt es sich um einen geschlossenen Linienzug mit identischem Anfang- und Endpunkt (z.B. einen See). Nach der Erfassung müssen den Daten Eigenschaften, wie beispielsweise Name und Adresse eines Nachtclubs, hinzugefügt werden. Diese Eigenschaften werden auch als Attribute bezeichnet. Hierfür können von den Mapper*innen Vorlagen verwendet werden, wobei hierbei nicht zwangsläufig alle Attribute erfasst werden, was Lücken in den Daten erklärt. Neben den „klassischen“ Attributen, wie Name und Adresse, werden in der Attributtabelle der Nachtclubs auch weitere Attribute aufgeführt. Hierzu gehören unter anderem die Attribute „wheelchair“, „payment“ und „level“.
Doch über welche Qualität verfügen OSM-Daten? Welche Rolle spielt dabei die Größe der Stadt? Und ist die Aktualität der Daten ersichtlich? Dies soll im Folgenden anhand des amenity-Schlüssels „Nachtclub“ in vier ausgewählten bayerischen Städten untersucht und näher beleuchtet werden. Als Städte wurden, aufgrund ihrer unterschiedlichen Einwohnerzahlen, München (rund 1,5 Mio. EW), Würzburg, (rund 130.000 EW), Passau (rund 50.000 EW) und Bad Kissingen (rund 24.000 EW) gewählt. Anschließend wurden die Daten mit den zugehörigen Google-Suchergebnissen abgeglichen. Bei Nachtclubs handelt es sich um kartiere Punktelemente.
In München sind 49 Nachtclubs in OSM kartiert (Stand: 08/2021). Über Google konnten 58 Nachtclubs gefunden werden. Google und OSM Abfragen waren hierbei nicht deckungsgleich. In OSM wurden Clubs kartiert, welche über die Google-Abfrage nicht gefunden wurden und umgekehrt. Auch die Datenqualität der OSM-Daten erwies sich in München als sehr heterogen. Während zu manchen Clubs Attributdaten wie Adresse, Kontaktdaten, Website und Öffnungszeiten hinterlegt waren, fehlten diese bei anderen gänzlich. Erwähnenswert ist zu den OSM-Daten der Münchener Clubs, dass in der Attributtabelle deutlich mehr Attribute geführt werden, als bei der Kartierung der Clubs in den anderen Städten. So können für die Münchener Clubs beispielweise Attribute wie „dance_styl“, „min_age“ oder „internet“ erfasst werden.
In Würzburg wurde circa die Hälfte aller existierenden Clubs in OSM kartiert (Stand 08/2021). Diejenigen Clubs, welche in OSM nicht kartiert wurden, konnten vollständig über die Google-Suche gefunden werden. Auch bei den über OSM kartieren Clubs in Würzburg ist die Datenqualität der Attributdaten, ähnlich wie in München, sehr heterogen, wobei prozentual gesehen mehr vollständige Adressangaben, Kontaktdaten und aktuelle Websites hinterlegt waren.
In Passau wurden rund dreiviertel aller existierenden Clubs in OSM kartiert (Stand 08/2021). Ebenso wie in Würzburg konnten diejenigen Clubs, welche nicht in OSM kartiert wurden vollständig über die Google-Suche gefunden werden. Die Datenqualität der Attributdaten erwies sich jedoch als deutlich schlechter im Vergleich zu den Daten der Würzburger Clubs. So war beispielsweise nur zu der Hälfte aller Clubs Adressdaten hinterlegt.
In Bad Kissingen existiert ein Nachtclub, welcher sowohl in OSM, als auch über Google zu finden ist (Stand 08/2021). Zu diesem Club wurden in OSM die Attributdaten fast vollständig hinterlegt.
Aus dieser nicht repräsentativen, stichprobenartigen Analyse wird deutlich, dass in kleineren Städten, in welchen es insgesamt weniger Clubs gibt, die Wahrscheinlichkeit höher ist, dass diese auch erfasst und kartiert werden. Allgemeine Aussagen über die Qualität der Attributdaten können allerdings nicht getroffen werden, da diese insgesamt sehr heterogen ist. Sie hinterlässt den Eindruck abhängig zu sein von der Anzahl und Motivation der Mapper*innen. Diese stichprobenhafte Untersuchung ist aufgrund des OSM-Prinzips jedoch nicht allgemeingültig und kann nicht auf andere Städte übertragen werden. In anderen Städten kann die Datenlage aufgrund der Bearbeitungsmöglichkeit für jedermann ganz anders aussehen.
Was die Aktualität der Daten betrifft, bleibt abschließend festzuhalten, dass es hierzu wohl am schwierigsten ist fundierte Aussagen zu treffen. Aufgrund der Corona-Situation und der unsicheren Zukunft der Nachtclubs bleibt abzuwarten, wie viele der aktuell in OSM kartierten Clubs überhaupt wieder öffnen werden.
Quellen:
Infos zu OSM: https://wiki.openstreetmap.org/wiki/DE:Beginners%27_guide https://www.openstreetmap.de/
EW Bad Kissingen: https://www.badkissingen.de/media/www.badkissingen.de/org/med_31094/121074_wohnbevoelkerung_01.01.2021.pdf
EW München:https://www.muenchen.de/sehenswuerdigkeiten/muenchen-in-zahlen.html
EW Würzburg: https://www.wuerzburg.de/buerger/statistikstadtforschung/bevoelkerung/31501.Bevoelkerung.html
EW Passau: https://www.passau.de/Aktuelles/Pressearchiv.aspx?rssid=1a5943f4-88c6-4522-a4ec-6c302083a228