marc
Joined: 08/12/2005 07:39:47
Messages: 4412
Offline
|
Ich habe heute wiedereinmal den Wikipedia Export runtergeladen und damit rumgespielt.
Die 23'000 (Stand 5 Februar) georeferenzierten Einträge in der Deutschen Wikipedia sehen auf googlemaps so aus :
http://www.geonames.org/maps/wikipedia.html
Die drei Fehler (!) auf der Einstiegsseite habe ich im Wikipedia soeben korrigiert. soviel zum Thema Wikipediaqualität ...
Falls jemand noch weitere Fehler findet, hier die Erläuterungen zur Wikipedia Georeferenzierung :
http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Georeferenzierung
Beim nächsten Wikipedia-Export werden diese Fehler dann auch bei geonames korrigiert sein.
Eine Volltext-Suche über die georeferenzierten Wikipediaeinträge ist hier :
http://www.geonames.org/wikipedia-search.html?
Aufgefallen ist mir, dass die Georeferenzierung im Deutschen Export viel homogener und damit einfacher zu parsen ist, als im Englischen Export. Im Englischen Export gibt es unzählige Formatvorlagen die man beim parsen berücksichtigen müsste.
PS, Hier die erwähnten Fehler :
- Einwohnerzahl von "Amiens" stimmt nicht, bzw ist doppelt im wikipedia (einmal richtig und einmal falsch).
- Einwohnerzahl von "Beaucaire (Gard)" stimmt nicht.
- Das "Metropolis-Haus" in Madrid ist keine Stadt und hat schon gar nicht 3 Millionen Einwohner.
Mit dem Update vom 5 Feb. sind die Fehler korrigiert. Es sind nun 24'000 Einträge. (editiert am 7 Feb 2006)
|