<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
	<channel>
		<title><![CDATA[Latest posts for the topic "Welcher Algorithmus bei Geonames-Website bei der Suche nach Geonamen?"]]></title>
		<link>http://forum.geonames.org/gforum/posts/list/3.page</link>
		<description><![CDATA[Latest messages posted in the topic "Welcher Algorithmus bei Geonames-Website bei der Suche nach Geonamen?"]]></description>
		<generator>JForum - http://www.jforum.net</generator>
			<item>
				<title>Welcher Algorithmus bei Geonames-Website bei der Suche nach Geonamen?</title>
				<description><![CDATA[ Hoi Marc

Kannst du den Algorithmus skizzieren (in Worten, Pseudcode), der hinter der Suche nach Geonamen steht auf der Geonames-Website?

Zusatzfrage: Ist das derselbe, wie derjenige bei den Webservices?

Hintergrund:  Ich arbeite (auch) mit PostgreSQL und bin am tüfteln, was die "beste" Lösung sein könnte (exact Match, Umlaute, StartsWith-Match, Metaphone, Levenshtein-Distance, tsearch2, etc.) und v.a. wieviel beim Partial Matching Zusatzinformationen einfliessen (Alternative Names, Ontologies, etc.).

Gruss, Stefan ]]></description>
				<guid isPermaLink="true">http://forum.geonames.org/gforum/posts/list/1762.page#7152</guid>
				<link>http://forum.geonames.org/gforum/posts/list/1762.page#7152</link>
				<pubDate><![CDATA[Sun, 7 Feb 2010 14:10:41]]> GMT</pubDate>
				<author><![CDATA[ stefan]]></author>
			</item>
			<item>
				<title>Re:Welcher Algorithmus bei Geonames-Website bei der Suche nach Geonamen?</title>
				<description><![CDATA[ Hallo Stefan

Für die Suche wird Lucene verwendet. Im Index stehen alle infos, unter anderem auch in ascii transkribiert. Für startsWith wird ab längeren string die entsprechende lucene funktion verwendet, für kleinere stehen die prefixe direkt im index. Die fuzzy search ist auch von lucene.

Um Datenquellen abzugleichen (zb mit Wikipedia) verwende ich zusätzlich auch andere Algorithmen (Levenshtein-Distance, etc). Diese werden bei der Suche aber nicht verwendet.

Gruss

Marc]]></description>
				<guid isPermaLink="true">http://forum.geonames.org/gforum/posts/list/1762.page#7199</guid>
				<link>http://forum.geonames.org/gforum/posts/list/1762.page#7199</link>
				<pubDate><![CDATA[Sun, 14 Feb 2010 16:37:06]]> GMT</pubDate>
				<author><![CDATA[ marc]]></author>
			</item>
	</channel>
</rss>