GeoNames Home | Postal Codes | Download / Webservice | About 

GeoNames Forum
  [Search] Search   [Recent Topics] Recent Topics   [Groups] Back to home page 
[Register] Register / 
[Login] Login 
Geonames und Wikipedia  XML
Forum Index -> Forum in Deutsch
Author Message
Kolossos


[Avatar]

Joined: 06/12/2006 21:35:50
Messages: 8
Offline

Hallo,
ich hab erst jetzt gesehen, dass ihr da soviele Wikipedia-Koordinaten gesammelt habt. Das erscheint mir fast wie eine Doppeltentwicklung mit:
http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Georeferenzierung/Wikipedia-World

Wobei wir natürlich auch noch ein paar andere Ziele haben, so möchten wir neben Error-Listen und Vorschlagslisten auch Bilddateien und anderes mit auslesen. Die genauere Type-Bestimmung erfolgt bei uns über Schlüsselwörter in den Kategorien.

Nun meine Fragen:
Wer von euch hat das gemacht oder kann zur Vorgehensweise etwas sagen?
Wie wurde es gemacht? Wurden die Dumps durch den Parser geschickt? Die Interwikilinks habt ihr sicher auch genutzt.
Habt Ihr eine Liste der Templates für die verschiedenen Sprachen?
Kann man die Wikipedia-Daten von euch runterladen?

Können wir irgendwas in Zukunft gemeinsam unternehmen?
Eure geäußerte Kritik an der Vielzahl der Vorlagen habe ich zur Kenntniss genommen, ggf. können wir dagegen seitens der Wikipedia was tuen.

Grüße Kolossos
[WWW]
marc



Joined: 08/12/2005 07:39:47
Messages: 4501
Offline

Hallo Kolossos

Das meiste habe ich programiert. Dazu werden die Dumps geparsed und die Templates sowie Interwikilinks und Kategorien ausgewertet.
Programiert ist es in java und die templates sind dort auch verdrated.

In welcher Sprache ist euer Parser geschrieben? Wenn es auch in java ist könnten wir Teile davon gemeinsam machen. Bezüglich des dump ist hier im Forum noch ein alter dump verlinkt. Ich kann auch einen neuen ziehen, wenn postgres für euch ok ist.

Gruss

Marc

[WWW]
Kolossos


[Avatar]

Joined: 06/12/2006 21:35:50
Messages: 8
Offline

Hallo Marc,
du arbeitest in Java, ich in PHP und Stefan in Perl (schöne neue Welt).
Stefan hat auch das Auslesen übernommen, so dass ich dazu nicht allzu viel sagen kann. Der Dump wäre vorallem mal wegen der Datenbankstruktur interessant. Ein alter Dump wäre also ausreichend, wo finde ich den? Wahrscheinlich arbeitest du sauber mit zwei Tabellen, eine für die Koordinaten+Parameter und eine für die Sprachvarianten. Ich habe als Nichtinformatiker vor den notwendigen SQL-Joint-Abfragen erstmal zurückgeschreckt und wir arbeiten mit einer Tabelle und je einer Spalte für die verschiedenen Sparchen. Unser Toolserver scheint erstmal wieder zu toolen (arbeiten), du kannst also mal vorbei schauen. Auf dem Toolserver sollten auch mal alle Texte in Echtzeit gespiegelt werden, sodass man auf die Dumps verzichten könnte. Im Moment haben wir auf dem Server nur alle anderen Datenbanktabellen,da diese nicht so fett sind.

Derzeit sammeln wir den Wust an Vorlagen über Interwikilinks in der Kategorie:Vorlage_mit_Koordinate
http://de.wikipedia.org/wiki/Kategorie:Vorlage_mit_Koordinate

Da wir beide Vollzeitjobs haben, würden wir Hilfe jederzeit begrüßen, aber du wirst ja hier genug zu tuen haben.... Grüße
[WWW]
marc



Joined: 08/12/2005 07:39:47
Messages: 4501
Offline

Hallo Kolossos

Ich habe den Link gefunden hier ist er :
http://forum.geonames.org/gforum/posts/list/126.page#756

Ja es sind zwei Tabellen wie du sagst, und noch eine dritte mit den links zwischen der geonameid und einer selbstberzeugten wikipediaid.

Ich werde mir euere Liste mal anschauen. Auf den ersten Blick scheint sicher die Mapit-US-cityscale zu fehlen. Oder geht es hier nur um deutsche Vorlagen?

Gruss

Marc

[WWW]
Kolossos


[Avatar]

Joined: 06/12/2006 21:35:50
Messages: 8
Offline

Wenn es nur um deutsche Vorlagen gehen würde, dann wäre unser Arbeitstitel sicherlich verfehlt. Ich denke wir ziehen allerdings einen Schlußstrich bei Sprachvarianten der Wikipedia von unter 25.000 Artikeln. Danke für den Hinweis mit der Mapit-Vorlage.
[WWW]
stefan



Joined: 19/10/2006 21:34:04
Messages: 2
Offline

Hoi Marc,

Habe soeben wieder einmal einen deiner raffinierten Webservice, Wikipedia-Map, getestet. Ich mache das jeweils mit meinem Geo-Directory (http://geometa.info/directory/). Dabei ist mir aufgefallen, dass da etliche Wikipedia-Artikel (de) fehlen, wenn ich z.B. nach [Rapperswil] suche. Hat offensichtlich mit dem Vorlagensalat zu tun, der auf Wikipedia immer noch herrscht?

Alle Wikipedia-Artikel (de), die auf geonames gefunden werden, enthalten die "Vorlage:Koordinate Artikel"; dabei ist glaube ich "Vorlage:Coordinate" aktuell - und wird u.a. auch bei "Vorlage:Infobox Ort in der Schweiz" verwendet - also bei ziemlich vielen Orten, inkl. Rapperswil SG.

Was meinst du dazu? Kannst du etwas zur "Wikipedia-Vorlagen-Harmonisierungs"-Diskussion und zu deinen Wikipedia-Parser-Plänen sagen?

Spatialist, http://www.gis.hsr.ch + http://geometa.info
Kolossos


[Avatar]

Joined: 06/12/2006 21:35:50
Messages: 8
Offline

Ja, wir haben wirklich auf Vorlage:Coordinate umgestellt, diese sollte auf jeden Fall berücksichtigt werden. Wikipedia-intern haben wir die Koordinaten das letzte Mal im Mai rausgeholt, da müssen wir also auch mal wieder ran.

Grüße Kolossos

P.S.:Bei der Gelegenheit ein kleines Rechtsthema: http://de.wikipedia.org/wiki/Wikipedia:Urheberrechtsfragen/Archiv/2008/September#Neue_cewe_Fotobuch-Software
Über die Kleinlichkeit mancher Leute kann ich nur den Kopf zütteln, aber unsere Texte stehen nun mal unter GFDL und nicht (noch nicht) unter CC-BY-SA. Unsere Koordinaten und derren Sammlung sehe ich zusammen mit Stefan Kühn wegen fehlender Schöpfungshöhe und um Behinderungen freien Wissens vorzubeugen fast am liebsten unter public domain mit Wunsch auf Quellennennung, CC ist also auch ok.
[WWW]
marc



Joined: 08/12/2005 07:39:47
Messages: 4501
Offline

Hallo Stefan

Du hast recht, das hat mit den hundertausen Vorlagen zu tun. Wenn du den xml export ansiehst sieht du, dass keine 'coor' Sachen zum Parsen drin sind:
http://de.wikipedia.org/wiki/Spezial:Exportieren/Rapperswil_SG

Bezüglich der Harmonisierung sind alle Initiativen eingeschlafen, von denen Ich wusste. Es ist praktisch unmöglich, da professionel vorgehen zu können. Und wenn ich, wie ich dem Link von Kolossos entnehmen kann, jetzt auch noch verklagt werden soll, habe ich ehrlich gesagt wenig Lust mich noch weiter mit Wikipedia zu beschäftigen.

Hallo Kolossos

Danke für den Link. Schade, dass Jimbo Wales nicht schon von Anfang an eine freie Lizenz gewählt hat und uns diese unsäglichen Diskussionen erspart hat. Eigentlich sollte man die Wikipedia verklagen, wenn sie als die 'freie Enzyklopädie' auftritt und dies auch im Logo hat und dann droht Leute zu verklagen die Koordinaten und den ersten Satz des Artikels verwenden.

Gruss

Marc

[WWW]
Kolossos


[Avatar]

Joined: 06/12/2006 21:35:50
Messages: 8
Offline

Hallo Marc,
ja bei der Geschichte mit den Lizenzen geb ich dir zu 100% Recht. Lass dich davon bitte nicht vergraulen.

Es gäbe eine recht professionelle Lösungsmöglichkeit, die sogar ohne Dump auskäme und damit immer aktuell seien könnte.
Wir haben auf dem Toolserver live Datenbankzugriff, dort gibt es die Tabelle "externallinks" dort ist für jeden georeferenzierten Artikel vorlagen- und sprachunabhängig der Link zum Geohack samt Koordinaten gespeichert.

Mir fehlt zur Umsetzung dieser Idee leider momentan die Zeit, wenn es bei dir anders aussieht und du Lust hättest, könntest du ja einen
Toolserveraccount http://meta.wikimedia.org/wiki/Toolserver/New_accounts beantragen.
Grüße Kolossos
[WWW]
 
Forum Index -> Forum in Deutsch
Go to:   
Powered by JForum 2.1.5 © JForum Team