[Talk-at] Fehlerbereinigung durch Oli-Wan

Oli-Wan mapjedi at toolserver.org
Thu Apr 11 10:53:38 UTC 2013


Hallo,

ich klinke mich jetzt doch mal hier ein.

Da sicher nicht alle das deutsche Forum verfolgen, möchte ich euch mal einen
Überblick geben, was ich da eigentlich veranstalte. Die komplette
Dokumentation findet ihr unter
http://wiki.openstreetmap.org/wiki/User:Oli-Wan/Wall-E .

Das Repertoire meines Roboters umfaßt inzwischen Korrekturen einiger sehr
häufiger (und eindeutiger) Fehler in Straßennamen und Adressen sowie
Leerraum in Tags und Rollen sowie die Beseitigung mehrfacher identischer Knoten.

Bei den Straßennamen geht es neben den üblichen Verdächtigen wie "Strasse"
und "Str." um Fälle wie "Stra0e", "Stra-e", "Sraße" und so weiter. Bei
Adressen werden zum einen in addr:street dieselben Fehler wie bei den
Straßennamen korrigiert, ferner Werte wie "Deutschland", "GERMANY" oder "de"
in addr:country zu "DE" umgetaggt und - wo dies sicher möglich ist - Straße
und Hausnummer bzw. PLZ und Ort getrennt, wenn diese zusammen in ein Tag
geschrieben wurden. Dazu noch ein paar Kleinigkeiten, siehe Wiki-Seite.

Diese Korrekturen sind natürlich landesspezifisch. Es ist sichergestellt,
daß sie tatsächlich nur in DE Anwendung finden (insbesondere nicht im
"Randüberschuß" des Geofabrik-Extrakts). Falls dies gewünscht sein sollte,
könnten sie auch auf AT angepaßt und dort ausgeführt werden, aber das ist
nicht mein aktuelles Anliegen.

Die Bereinigung überschüssigen Leerraums ist dagegen nicht landesspezifisch.
Bei dieser geht es tatsächlich nur um Leerraum am Anfang und/oder Ende von
Schlüsseln, Werten und Rollen, also " key"=value, key="value " oder role="
whatever ". Wirklich problematisch ist dieser nur in bestimmten Fällen: ein
"name " wird von keiner Anwendung ausgewertet, und kein Renderer wird
landuse=" residential" beachten. In Freitext-Werten ist er relativ harmlos:
in name="Hauptstraße " gehört er zwar kein Leerzeichen hin, aber so richtig
schlimm ist es auch nicht. Allerdings hat sich die ursprünglich angedachte
Unterscheidung zwischen Freitext- und Festwert-Tags als unpraktikabel
herausgestellt, daher wird er in sämtlichen Tags beseitigt (einige Ausnahmen
sind auf der Wiki-Seite erläutert).

Diese Korrektur könnte ich, euer Einverständnis vorausgesetzt, auf AT ausdehnen.

Freilich muß man sagen: tu felix Austria - bei euch bleiben derzeit ganze
zwei Schlüssel, vierzehn Werte und 45 Rollen im Filter hängen - in
Deutschland waren allein vom Leerraum in Schlüsseln und Werten über 2000
Objekte betroffen. Von daher dürfte eine monatliche Ausführung völlig
ausreichend sein, um Leerraum in AT unter Kontrolle zu halten.

Ebenfalls nicht landesspezifisch ist die Bereinigung mehrfacher aufeinander
folgender identischer Knoten in Wegen (also etwa A-B-B-C, aber nicht
A-B-C-D-A). Größtenteils stammen diese Fälle aus einem alten Potlatch-Bug
(ganz selten spielt dabei aber sogar JOSM mit). In früheren Zeiten waren
solche Wege ein großes Problem (eine der Hauptaufgaben des damaligen xybot).
Inzwischen wurde der Potlatch-Bug aber zumindest teilweise gefixt, sodaß der
Fehler nun recht selten ist: aktuell gibt es 17 betroffene Wege in DE, 5 in AT.

Auch die Korrektur dieser Wege könnte ich auf AT ausdehnen (ebenfalls
monatlich), sobald sie in DE erfolgreich läuft. Bisher wird das Programm
noch nicht ausgeführt: Der Vorschlag steht erst ganz frisch im Forum und ich
will den Code erst noch weiter testen, bevor ich ihn auf die Live-Datenbank
loslasse; aber bisher gab es im Forum keine Einwände und prinzipiell sollte
bei der Korrektur auch nichts schiefgehen können.

Mittelfristig möchte ich diesen einen Algorithmus sogar weltweit laufen
lassen, aber dafür würde ich gerne eine gewisse Referenz vorweisen können à
la "das Programm läuft seit k Monaten in m Ländern und hat fehlerfrei n Wege
bearbeitet". Deshalb hätte ich Österreich gern mit im "Testgebiet".

Gruß

Oliver / Oli-Wan





More information about the Talk-at mailing list