GeoNames Home | Postal Codes | Download / Webservice | About 

GeoNames Forum
  [Search] Search   [Recent Topics] Recent Topics   [Groups] Back to home page 
[Register] Register / 
[Login] Login 
Datenbank-Struktur inkl. Welt, Kontinenten und Regionen  XML
Forum Index -> Forum in Deutsch
Author Message
Eddie



Joined: 26/04/2006 13:04:15
Messages: 7
Offline

[edit: hier nochmal die Originalfrage, die kurzzeitig mal verschwunden war ]

Hallo allerseits,

da ich neu bin hier, erstmal ein riesen Kompliment für dieses Projekt, ich bin restlos begeistert!

Folgendes Problem habe ich gerade: wenn ich das richtig sehe, repräsentiert die GeoNames-DB ja im Grunde einen Baum, dessen oberstes Level auf Länderebene liegt. Es gibt also keine eindeutige Wurzel "Welt". Darum möchte ich den Baum um mehrere Ebenen erweitern: Welt, Kontinente und Regionen (bspw. Südostasien). Erst darunter sollen sich dann die Länder (mit Class A, Code PCLI) finden.

Wichtig ist mir dabei allerdings, dass ich auch bei zukünftigen Änderungen der GeoNames-Daten[1] nicht gleich mein ganzes Projekt neu aufsetzen muss. Darum will ich die Regionen- und die Geonames-Daten in getrennten Tabellen halten. Die beiden separaten Bäume zu verknüpfen wäre ja nicht das Problem, ich bräuchte nur bei den Ländern (PCLI) einen Fremdschlüssel auf die Regionentabelle. In meinen Augen macht das Sinn, aber ich bin nicht wirklich der Datenbank-Profi... :-/

Darum grundsätzlich die Frage: worauf sollte ich bei der Modellierung der DB besonders achten, um auch spätere Änderungen[1] leicht integrieren zu können?

Und außerdem würde mich interessieren, wie ihr zusätzliche Länderdaten (etwa aus countryInfo.txt oder vom CIA World Factbook) in die DB integrieren würdet?

Danke euch,
Eddie

[1] unter http://www.geonames.org/export/ heißt es ja: "The webservice and database export are early beta and subject to change."
marc



Joined: 08/12/2005 07:39:47
Messages: 4271
Offline

Ich habe aus Versehen auf Edit statt Reply gedrückt und deinen Beitrag editiert. Bitte tausendmal um Entschuldigung. Leider konnte ich deinen Ursprungstext nicht mehr zurücksetzen.

erstmal ein riesen Kompliment für dieses Projekt, ich bin restlos begeistert! 

Vielen Dank.

Darum möchte ich den Baum um mehrere Ebenen erweitern: Welt, Kontinente und Regionen (bspw. Südostasien).  


Daran habe ich auch schon gedacht, bin aber noch nicht dazu gekommen. Eine erste Einteilung in Kontinente besteht bereits : http://download.geonames.org/export/dump/countryInfo.txt (letzte Spalte)

Ich denke am besten wäre es für die Regionen die UN Einteilung zu übernehmen :
http://unstats.un.org/unsd/methods/m49/m49regin.htm
Oder kennst Du einen besseren Regionen-Standard?

Das Problem das eventuell auftauchen könnte sind Überseeterritorien, frühere Kolonien die auf einem anderen Kontinent sind aber zum Mutterland gehören. In den Fällen, wo dieses Gebiet einen eigenen ISO-CountryCode hat, ist es in der GeonamesDB als eigenes Land geführt. Aber auch in diesen Fällen könnte es interessant sein diese Abhängigkeit zu modellieren.

Darum aber grundsätzlich die Frage: worauf sollte ich bei der Modellierung dieser DB besonders achten, um auch spätere Änderungen[1] leicht integrieren zu können? 

Wärst Du allenfalls bereit deine Regionen-DB dem Geonames-Projekt beizusteuern? Dann hast du sicher am wenigsten ärger. Für den Anfang würde ich mir eine zusätzliche Spalte in der Datei countryInfo.txt mit dem Regionencode vorstellen. Später brauchen die Regionen dann auch Namen in allen Sprachen und eine id in der GeonamesDB.

Marc

[WWW]
Eddie



Joined: 26/04/2006 13:04:15
Messages: 7
Offline

Hi Marc,

Daran habe ich auch schon gedacht, bin aber noch nicht dazu gekommen. Eine erste Einteilung in Kontinente besteht bereits : http://download.geonames.org/export/dump/countryInfo.txt (letzte Spalte) 

Genau, habe ich gesehen! Da fehlt dann ggf. noch die "Zwischenebene" mit überregionalen Einteilungen.

Ich denke am besten wäre es für die Regionen die UN Einteilung zu übernehmen :
http://unstats.un.org/unsd/methods/m49/m49regin.htm
Oder kennst Du einen besseren Regionen-Standard? 

Nein, ich kenne nichts Besseres. Alles was ich bisher gefunden habe, basiert nicht auf Normen, sondern Übereinkünften. So unterscheidet sich bspw. die Einteilung der CIA (s. obiger Link) von der des Auswaertigen Amtes. Allein die Frage nach dem Unterschied zwischen "Naher Osten" (deutsch) und "Middle East" (englisch/US-englisch?) ist meines Wissens pure Auslegungssache. Und zu welchem Kontinent gehört Zypern???
Ich habe mir ehedem die Einteilung selbst zurechtgelegt, basierend auf den verschiedenen Quellen, aber möglicherweise wäre da eine flexiblere Einteilung sinnvoll - bspw. die Unterstützung mehrerer Normen, unter denen man dann eine Variante wählen kann.

Wärst Du allenfalls bereit deine Regionen-DB dem Geonames-Projekt beizusteuern? 

Klar, kann ich schon machen. Ist halt fraglich, wieviel Sinn das macht, denn es ist letztlich nur eine einzige individuelle Sichtweise.
Prinzipiell ist das Ziel schon, obige Datei countryInfo.txt ganz im normalen DB-Dump aufgehen zu lassen, oder?

Später brauchen die Regionen dann auch Namen in allen Sprachen und eine id in der GeonamesDB. 

Das wuerde mich ohnehin interessieren, wie ist das mit den Namen? In der name-Spalte steht immer der Name in Landessprache, oder?
Gibt es eine Möglichkeit, zu entscheiden, welches der international gaengigste Name ist? Ein ganz typisches Beispiel bei mir ist "Krung Thep" - mit den Alternativnamen "Bangkok" und "Bangkok Metropolis". Steht der gaengigste Name also immer an Platz eins der Alternativ-Namen?

Eddie
marc



Joined: 08/12/2005 07:39:47
Messages: 4271
Offline

Hallo Eddie

Da habe ich aber Glück gehabt, dass Du deinen Beitrag noch gespeichert hattest. Den Letzten Satz über die Länderdaten habe ich beim erstenmal gar nicht gesehen.

Genau, habe ich gesehen! Da fehlt dann ggf. noch die "Zwischenebene" mit überregionalen Einteilungen.  

Richtig, so ist es gedacht. Oder sogar mehrere Spalten wie beim Ländercode, falls mehrere Standards unterschieden werden sollen. (Was Du unten ja auch schreibst.)

Prinzipiell ist das Ziel schon, obige Datei countryInfo.txt ganz im normalen DB-Dump aufgehen zu lassen, oder?  

Sicher wird jeder Regionen-Eintrag eine geonameId erhalten. Wenn man sich auf einen Standard einigen kann wird die Haupttabelle einfach um eine Spalte erweitert, wo dann der RegionenCode steht. Fall aber mehrere sich widersprechende Standards untersützt werden sollen muss diese Info zwangsläufig separat gespeichert sein.
Die Datei countryInfo.txt wird sicher länger (oder immer) bestehen da wahrscheinlich noch mehr Länderinfos dazukommen werden wie Telefonvorwahl(en), Währung(en), Landesprachen, Nachbarn, Postleitzahlformat etc. Gut wäre wenn man das CIA Worl Factsbook in einem besseren Format als HTML erhalten könnte.

Das wuerde mich ohnehin interessieren, wie ist das mit den Namen? In der name-Spalte steht immer der Name in Landessprache, oder?  


Es steht eher der international gängige Name in der Namesspalte. Bei den Alternativnamen gibt es noch kein Sortierkriterium. Das muss ich noch einbauen. Auf der Datenbank bereits vorhanden aber noch nirgends angezeigt ist die Spalte 'isOfficialName'.

Marc

[WWW]
 
Forum Index -> Forum in Deutsch
Go to:   
Powered by JForum 2.1.5 © JForum Team