Impressum   

Häufigkeitsverteilung von OSM Tag

In der deutschen Mailingliste kommt immer wieder die Frage auf, wie man sich die für einen Auszug von OSM Daten die Häufigkeit von den wichtigtsen Tags ansehen kann. Hier ist aber nicht nur an die Häufigkeit der Schlüssel und der Ausprägungen gedacht, sondern auch an der Kombination von Tags.

Für eine Übersicht ist immer eine Grafik sinnvoll und diese sollte häufig genutzte Werte auch größer darstellen. Schön wäre es dann auch, wenn man auf einzelne Ausprägungen filtern könnte und sich diesen Datensauschnitt genauer ansehen könnte.

Durch die gewünschte Dynamik war die Verwendung der Javascript Library D3 schnell klar, zumal zahlreiche Beispiele existieren.

Für einen ersten Prototypen habe ich mich für die Grafiktyp "Sonnendurchbruch" ("sunburst") entschieden, die Implementierung beruht auf die Arbeit von Edurard Trott. grafische Aufbereitung von OSM Tags Fährt man mit der Maus über die Kreissegmente, erhält man ein Tooltip mit Information über Inhalt und Anzahl der entsprechenden OSM-Objekte. Drückt man auf ein Segment wird die Darstellung auf das Segment und seine Nachfolger reduziert. Ein anschließender Klick auf den Mittelkreis stellt wieder die gesamte Datenlage wieder her.

Das PHP-Programm liest die OSM-Datei (erzeugt von der Seite overpass-turbo.eu) und erzeugt die notwendige JSON-Datei. Bei einigen Schlüsseln (wie Adress-Schlüsseln oder Telefon-Nummer) wird nur die Existenz dargestellt, da sonst die Anzahl der Ausprägungen der Segmente schnell zu groß wird. Der häufigste Schlüssel liegt bei der Kreismitte, die seltenen Schlüsseln am Kreisrand.

Als Anwendungstest habe ich nach allen Namen gesucht, die den Begriff "Dänisches Bettenlager" beinhalten (siehe Overpass-Turbo Abfrage). Die Firma wirbt aktuell gerade mit 2.500 Filialen (weltweit). Um es kurz zu halten: am 1.11.2017 habe ich 801 OSM-Objekte gefunden. Dies liegt aber auch daran, dass nicht weltweit die Marke "Dänisches Bettenlager" verwendet wird.

Die Daten stelle ich in zwei Aufbereitungen (in einem separaten Fenster) zur Verfügung. Einmal nur dem zehn häufigsten Schlüsseln als auch mit allen 105 Schlüsseln (von name (801), shop (744), addr:street (392) über website(127) bis zu url (1), wetland (1), wheelchair:note(1)). Zm Verstehen der Klick-Logik empfehle ich die reduzierte Grafik. Die Aufbaugeschwindigkeit liegt auch an der Leistungsfähigkeit Ihres Rechners.

english

Frequency distribution of OSM Tag

In the German mailing list the question arises again and again, how to check the frequency of the most important tags for an extract of OSM data. Here, however, not only the frequency of the keys and their characteristics is considered, but also the combination of tags.

For an overview, it is always advisable to use a graphic which should also display frequently used values larger. It would also be nice, if you could filter for individual characteristics and have a closer look at this data section.

Due to the desired dynamics, the use of the Javascript Library D3 was quickly clear, especially since there are numerous examples.

For a first prototype I decided to use the graphic type "sunburst", the implementation is based on the work of Edurard Trott. grafische Aufbereitung von OSM Tags If you move the mouse over the circle segments, you get a tooltip with information about the content and number of the corresponding OSM objects. If you press a segment, the representation is reduced to the segment and its successors. A subsequent click on the center circle restores the entire data situation.

The PHP program reads the OSM file (created by overpass-turbo.eu) and creates the necessary JSON file. With some keys (such as address keys or telephone numbers) only the existence is shown, because otherwise the number of the characteristics of the segments quickly becomes too large. The most common key is the circle center, the rarest keys at the edge of the circle.

As an application test I have searched for all names containing the term "Dänisches Bettenlager" (see Overpass-Turbo query). The company is currently advertising with 2,500 stores (worldwide). To keep it short: on 1.11.2017 I found 801 OSM objects. This is also due to the fact that the brand "Dänisches Bettenlager" isn't used worldwide.

The data is available in two forms (in a separate window). Once only the ten most common keys as well as with all 105 keys (von name (801), shop (744), addr:street (392) via website(127) to url (1), wetland (1), wheelchair:note(1)). To understand the click logic I recommend the reduced graphic. The speed of installation is also due to the performance of your computer.