LAW3 Location-Aware World Wide Web

Ziele

Mit der wachsenden Verbreitung mobiler Endgeräte und moderner Funkübertragungsnetze wie WLAN, GPRS oder UMTS haben ortsabhängige Dienste, so genannte Location Based Services (LBS), stark an Bedeutung gewonnen. Sie versorgen einen mobilen Menschen mit Informationen über seine aktuelle Umgebung und geben dabei Antwort auf Fragen wie „Wo ist das nächste italienische Restaurant“ oder „Wo ist das nächste Museum mit zeitgenössischer Kunst?“.

 

Neben dem Aufbau der notwendigen Infrastruktur erfordert insbesondere die Bereitstellung und Aufbereitung der ortsbasierten Informationen einen großen Aufwand. Es ist daher von großen Interesse, derartige Informationen möglichst automatisch aus vorhandenen Informationsquellen zu gewinnen. Hierzu bietet sich das World Wide Web an: Praktisch alle gewünschten Informationen, z.B. über Restaurants, Museen und dergleichen sind hier bereits zu finden. Eine Suche im WWW lässt sich jedoch nicht ohne weiteres nach geographischen Gesichtspunkten durchführen. Das Projekt LAW3 leistet einen Beitrag dazu, diese Situation nachhaltig zu verändern.

 

Ziel von LAW3 ist die Erstellung einer Suchmaschine, die ähnlich den heute gängigen Suchmaschinen eine Volltextsuche nach Schlüsselwörtern anbietet, zusätzlich aber das Einbringen geographischer Kriterien in die Anfrage ermöglicht. So kann beispielsweise das WWW nach dem Begriff „Restaurant“ im Umkreis von 5 km zur aktuellen Aufenthaltsposition durchsucht, die Ergebnisse nach Entfernung sortiert und auf einer Karte angezeigt werden.

 

Für LAW3 sind hier vorrangig zwei Aufgaben zu bearbeiten:

Die Indexierung von Webseiten, um eine volltextbasierte Suche im WWW zu ermöglichen, wird von den heute gängigen Suchmaschinen verwendet und ist recht weit entwickelt. Hier wird auf vorhandene Lösungen aufgebaut.

Das Auffinden von Webseiten mit Geoinformationen wie z.B. Adres-sen (Crawling), die Identifikation der Geoinformationen (Geoparsing) und die Umwandlung in Geokoordinaten (Geocoding) macht den Hauptteil der Arbeiten aus. Insbesondere das Crawling ist aufgrund der Ausmaße des heutigen WWW sehr ressourcenintensiv und erfordert über einen auch nur annähernd vollständigen Teilbereich des WWW einen sehr großen Zeit- und Hardwareaufwand. Nach allgemeinen Schätzungen enthalten aber nur etwa 10-20% aller Webseiten eine Ortsinformation. Noch geringer ist der Anteil von Webseiten, die die von LAW3 gewünschte Granularität der Ortsinformation liefern, gebäudegenau und auf den mobilen Fußgänger ausgerichtet. Daher sind in LAW3 heuristische Verfahren entwickelt worden, die es ermöglichen, das Crawling auf potentiell interessante Kandidaten einzuschränken und so den Aufwand stark einzugrenzen.

 

Das Geoparsing, die Untersuchung auf Vorliegen einer Ortsangabe der gewünschten Form, kann sehr effektiv durchgeführt werden, da beim Crawling bereits eine Vermutung darüber vorliegt, um welche Ortsangabe es sich handeln könnte. Im Erfolgsfall wird der zugehörigen Webseite eine Geokoordinate zugewiesen (Geocoding). Die Geokoordinaten dienen dann als Grundlage für die geographischen Suchanfragen. Spezifische Zugriffsstrukturen ermöglichen hierbei einen effektiven Zugriff auf diese Geokoordinaten nach geo-graphischen Kriterien.

 

Die Vorgehensweise von LAW3 ist über alle Teilschritte regionalisiert. Dieses Vorgehen bietet unter anderem den Vorteil, dass der grundlegende Datenbestand für einzelne Regionen relativ schnell aufgebaut werden kann. Mit Hilfe des Konzeptes verteilter Suchmaschinen lassen sich diese Regionen zu größeren Gebieten zusam-menschließen, so dass eine flächendeckende geographische Suche im WWW möglich wird.

Personen

Wissenschaftliche Leitung

Laufzeit

Start: 01.01.2004
Ende: 21.09.2009