GeoNames Home | Postal Codes | Download / Webservice | About 

GeoNames Forum
  [Search] Search   [Recent Topics] Recent Topics   [Groups] Back to home page 
[Register] Register / 
[Login] Login 
Unterschiedliche Datenbestände - Webservice <> Dumps  XML
Forum Index -> Forum in Deutsch
Author Message
marvet



Joined: 03/01/2007 17:33:02
Messages: 7
Offline

Hallo zusammen,

erstmal Gratulation zu diesem wirklich sehr interessanten und umfassenden Projekt und den damit verbundenen Daten und Diensten.

Zur Frage
Für unser Projekt möchten wir primär den Webservice zur Suche nach Ortsnamen nutzen. Ergänzend möchten wir - als Backup - eine lokale Datenbank mittels der bereitgestellten Dumps anlegen.

Probehalber haben wir heute die deutschen Orte aus der "DE.zip" ausgelesen und in einer Datenbank angelegt. Allerdings sind uns bei ersten Abfragen einige Unterschiede in den Ergebnissen aufgefallen:

Bei einer Suche nach dem Ort "Koeln" über den Webservice erhalten wir eine Liste mit ca. 190 Einträgen. In den ersten Einträgen ist der Name des Ortes in der Spalte "name" jeweils nur mit "Köln" angegeben.
Bei einer Abfrage unserer Datenbank finden wir nur ca. 20 Einträge zu "Koeln" und "Köln". Jedoch handelt es sich hierbei vorrangig um Bahnhöfe im Kölner Raum. Die Einträge in der Namensspalte ("name") sind stets mit dem Zusatz "Bahnhof Köln ..." versehen.

Eingelesen haben wir knapp 160.000 Ortsdaten aus der "DE.zip". Ist diese Anzahl in Ordnung, oder haben wir ggf. nur einen Teil der Daten eingelesen / fehlen Daten?

Wir wundern uns nur über den Unterschied im Ergebnis. Insbesondere machen uns die vielen Einträge unter dem Namen "Köln" im Webservice stutzig. In unserer Datenbak findet sich kein einziger Eintrag, der nur "Köln" in der Spalte "name" stehen hat.

Ferner haben wir noch eine Frage zur Postleitzahlendatenbank.
Enthält der Dump ausschließlich ergänzende Informationen zu den anderen Datenbankbeständen (muss also bei der Erstellung einer Datenbank eine Referenz zwischen zwei Tabellen stattfinden), oder enthält der Dump vollumfängliche Daten (also Ortsname, Postleitzahl, Längen-/Breitengrad, Zeitzone usw.)?

Vorab vielen Dank für Eure Unterstützung!

Beste Grüße aus Köln,
Markus
marc



Joined: 08/12/2005 07:39:47
Messages: 4412
Offline

Hallo Markus

Der Webservice liefert alle Orte, die den Suchbegriff irgendwie umfassen (zB admin2) und nicht nur diejenigen die den Namen genau so haben. Wenn man genau nach dem Namen suchen möchte, sollte man den Parameter name_equals verwenden : http://www.geonames.org/export/geonames-search.html

Der PLZ dump und der 'normale' geonames dump sind zwei unterschiedliche Datenbanktabellen und enthalten nicht exakt dieselben Informationen. Die Zeitzone zum Bsp fehlt noch im PLZ dump.

Gruss

Marc

[WWW]
marvet



Joined: 03/01/2007 17:33:02
Messages: 7
Offline

Hallo Marc,

vielen Dank für Deine schnelle Antwort.

Was mich aber dennoch irritiert ist, daß ich bei einer Abfrage über den Webservice eine Vielzahl von Einträgen erhalte, die in der Spalte "name" nur den Wert "Köln" haben. Diese Datensätze konnte ich dem Dump überhaupt nicht entnehmen. Bei einer Suche in unserer Datenbank (Werte "koeln" und "köln" in den Spalten "name", "asciiname", "alternatenames") erhalte ich folgendes Ergebnis:

2886242 Cologne
6296510 Koeln / Bonn
2806106 Bahnhof Köln-Worringen
2819224 Unterköln
2860037 Oberköln
2864692 Neuköln
2886223 Bahnhof Köln
2886224 Bahnhof Köln-Sülz
2886225 Bahnhof Köln Süd
2886227 Bahnhof Köln-Nippes
2886228 Bahnhof Köln-Mülheim
2886229 Bahnhof Köln-Kalk
2886230 Kölnische Kanzel
2886231 Kölnische Höfe
2886232 Bahnhof Köln-Holweide
2886235 Kölner Bucht
2886236 Köln-Eifeltor
2886237 Bahnhof Köln-Ehrenfeld
2886238 Bahnhof Köln-Deutz
2886239 Bahnhof Köln-Dellbrück
2886240 Kölnberg
2886241 Regierungsbezirk Köln
2886242 Cologne
3207676 Köln-Bonn
3247451 Kreisfreie Stadt Köln

Einen Datensatz, dessen Wert in der Spalte "name", "asciiname" oder "alternatenames" nur "Köln" ist, liegt mir also garnicht vor.

Request URI WS
http://ws.geonames.org/postalCodeSearch?country=DE&placename=koeln&maxRows=100

Ein weiteres Beispiel:
Wenn ich über den Webservice nach dem Ortsnamen "Frechen" suche, erhalte ich exakt einen Datensatz zurück. Die Längen- und Breitengrad Angaben variieren jedoch von denen, die ich für den Ort Frechen dem Dump "DE.zip" entnehmen konnte.

Werte Dump:
Frechen, Lat 50.9166667 / Lng 6.8166667

Werte Webservice:
Frechen, Lat 50.9132857142857 / Lng 6.81518571428571

Request URI WS
http://ws.geonames.org/postalCodeSearch?country=DE&placename=frechen&maxRows=100

Wie kommt es zu diesen Unterschieden in den Ergebnissen?

Nochmals vielen Dank!

Beste Grüße,
Markus
marc



Joined: 08/12/2005 07:39:47
Messages: 4412
Offline

Hallo Markus

1. Die Daten im 'geonames' Dump, den du offensichtlich verwendest, sind nicht exakt identisch mit dem PLZ Webservice. Du musst den PLZ dump für einen Vergleich verwenden. Für die Stadt Köln gibt es zum Beispiel mehrere PLZs.

2. Der Webservice sucht nicht nur über den Namen sondern auch über allen anderen Feldern, wie Bundesland, Gemeinde und was es sonst noch so gibt.

Beste Grüsse

Marc

[WWW]
marvet



Joined: 03/01/2007 17:33:02
Messages: 7
Offline

Hallo Marc,

vielen Dank! Nun ist alles klar.

Beste Grüße,
Markus
 
Forum Index -> Forum in Deutsch
Go to:   
Powered by JForum 2.1.5 © JForum Team