Author |
Message |
03/01/2007 20:32:35
|
marvet
Joined: 03/01/2007 17:33:02
Messages: 7
Offline
|
Hallo zusammen,
erstmal Gratulation zu diesem wirklich sehr interessanten und umfassenden Projekt und den damit verbundenen Daten und Diensten.
Zur Frage
Für unser Projekt möchten wir primär den Webservice zur Suche nach Ortsnamen nutzen. Ergänzend möchten wir - als Backup - eine lokale Datenbank mittels der bereitgestellten Dumps anlegen.
Probehalber haben wir heute die deutschen Orte aus der "DE.zip" ausgelesen und in einer Datenbank angelegt. Allerdings sind uns bei ersten Abfragen einige Unterschiede in den Ergebnissen aufgefallen:
Bei einer Suche nach dem Ort "Koeln" über den Webservice erhalten wir eine Liste mit ca. 190 Einträgen. In den ersten Einträgen ist der Name des Ortes in der Spalte "name" jeweils nur mit "Köln" angegeben.
Bei einer Abfrage unserer Datenbank finden wir nur ca. 20 Einträge zu "Koeln" und "Köln". Jedoch handelt es sich hierbei vorrangig um Bahnhöfe im Kölner Raum. Die Einträge in der Namensspalte ("name") sind stets mit dem Zusatz "Bahnhof Köln ..." versehen.
Eingelesen haben wir knapp 160.000 Ortsdaten aus der "DE.zip". Ist diese Anzahl in Ordnung, oder haben wir ggf. nur einen Teil der Daten eingelesen / fehlen Daten?
Wir wundern uns nur über den Unterschied im Ergebnis. Insbesondere machen uns die vielen Einträge unter dem Namen "Köln" im Webservice stutzig. In unserer Datenbak findet sich kein einziger Eintrag, der nur "Köln" in der Spalte "name" stehen hat.
Ferner haben wir noch eine Frage zur Postleitzahlendatenbank.
Enthält der Dump ausschließlich ergänzende Informationen zu den anderen Datenbankbeständen (muss also bei der Erstellung einer Datenbank eine Referenz zwischen zwei Tabellen stattfinden), oder enthält der Dump vollumfängliche Daten (also Ortsname, Postleitzahl, Längen-/Breitengrad, Zeitzone usw.)?
Vorab vielen Dank für Eure Unterstützung!
Beste Grüße aus Köln,
Markus
|
|
|
03/01/2007 22:23:52
|
marc
Joined: 08/12/2005 07:39:47
Messages: 4412
Offline
|
Hallo Markus
Der Webservice liefert alle Orte, die den Suchbegriff irgendwie umfassen (zB admin2) und nicht nur diejenigen die den Namen genau so haben. Wenn man genau nach dem Namen suchen möchte, sollte man den Parameter name_equals verwenden : http://www.geonames.org/export/geonames-search.html
Der PLZ dump und der 'normale' geonames dump sind zwei unterschiedliche Datenbanktabellen und enthalten nicht exakt dieselben Informationen. Die Zeitzone zum Bsp fehlt noch im PLZ dump.
Gruss
Marc
|
|
|
|
04/01/2007 10:43:35
|
marvet
Joined: 03/01/2007 17:33:02
Messages: 7
Offline
|
Hallo Marc,
vielen Dank für Deine schnelle Antwort.
Was mich aber dennoch irritiert ist, daß ich bei einer Abfrage über den Webservice eine Vielzahl von Einträgen erhalte, die in der Spalte "name" nur den Wert "Köln" haben. Diese Datensätze konnte ich dem Dump überhaupt nicht entnehmen. Bei einer Suche in unserer Datenbank (Werte "koeln" und "köln" in den Spalten "name", "asciiname", "alternatenames") erhalte ich folgendes Ergebnis:
2886242 Cologne
6296510 Koeln / Bonn
2806106 Bahnhof Köln-Worringen
2819224 Unterköln
2860037 Oberköln
2864692 Neuköln
2886223 Bahnhof Köln
2886224 Bahnhof Köln-Sülz
2886225 Bahnhof Köln Süd
2886227 Bahnhof Köln-Nippes
2886228 Bahnhof Köln-Mülheim
2886229 Bahnhof Köln-Kalk
2886230 Kölnische Kanzel
2886231 Kölnische Höfe
2886232 Bahnhof Köln-Holweide
2886235 Kölner Bucht
2886236 Köln-Eifeltor
2886237 Bahnhof Köln-Ehrenfeld
2886238 Bahnhof Köln-Deutz
2886239 Bahnhof Köln-Dellbrück
2886240 Kölnberg
2886241 Regierungsbezirk Köln
2886242 Cologne
3207676 Köln-Bonn
3247451 Kreisfreie Stadt Köln
Einen Datensatz, dessen Wert in der Spalte "name", "asciiname" oder "alternatenames" nur "Köln" ist, liegt mir also garnicht vor.
Request URI WS
http://ws.geonames.org/postalCodeSearch?country=DE&placename=koeln&maxRows=100
Ein weiteres Beispiel:
Wenn ich über den Webservice nach dem Ortsnamen "Frechen" suche, erhalte ich exakt einen Datensatz zurück. Die Längen- und Breitengrad Angaben variieren jedoch von denen, die ich für den Ort Frechen dem Dump "DE.zip" entnehmen konnte.
Werte Dump:
Frechen, Lat 50.9166667 / Lng 6.8166667
Werte Webservice:
Frechen, Lat 50.9132857142857 / Lng 6.81518571428571
Request URI WS
http://ws.geonames.org/postalCodeSearch?country=DE&placename=frechen&maxRows=100
Wie kommt es zu diesen Unterschieden in den Ergebnissen?
Nochmals vielen Dank!
Beste Grüße,
Markus
|
|
|
04/01/2007 20:12:48
|
marc
Joined: 08/12/2005 07:39:47
Messages: 4412
Offline
|
Hallo Markus
1. Die Daten im 'geonames' Dump, den du offensichtlich verwendest, sind nicht exakt identisch mit dem PLZ Webservice. Du musst den PLZ dump für einen Vergleich verwenden. Für die Stadt Köln gibt es zum Beispiel mehrere PLZs.
2. Der Webservice sucht nicht nur über den Namen sondern auch über allen anderen Feldern, wie Bundesland, Gemeinde und was es sonst noch so gibt.
Beste Grüsse
Marc
|
|
|
|
05/01/2007 10:39:51
|
marvet
Joined: 03/01/2007 17:33:02
Messages: 7
Offline
|
Hallo Marc,
vielen Dank! Nun ist alles klar.
Beste Grüße,
Markus
|
|
|
|