direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Logo der TU Berlin

PJ Information Retrieval Projekt

Information Retrieval Projekt

Semester: Sommersemester 2006
Art: PJ6
LV-Nr.: 0435 L 724
Veranstalter: Albayrak
Zeit: Dienstag, 10:00 - 12:00 Uhr im GOR 109 (Salzufer 12)
  (Bei Bedarf kann auch ein anderer Termin vereinbart werden)
Erster Termin: 25.04.2006
Teilnehmerzahl: maximal 20 Studierende

Beschreibung

Information Retrieval ist ein bedeutendes Forschungsgebiet der Informatik. Das Herausfiltern von relevanten Informationen aus verschiedenen Datenquellen stellt im Hinblick auf die Fülle irrelevanter Information im Internet zu eine nicht triviale Aufgabe dar.

 

Grundlage für dieses Projekt ist ein umfangreicher Dokumenten-Korpus und eine Infrastruktur für informationsfilternde Agenten. Das übergeordnete Projektziel besteht nun darin, eine Community von Filteragenten zu entwickeln, die, ausgestattet mit unterschiedlichen Filterstrategien und -fähigkeiten, Suchanfragen an den vorhandenen Dokumenten-Korpus möglichst exakt und effizient zu beantworten. Hierzu konzipiert und entwickelt jede Arbeitsgruppe (3-4 Studierende) einen Filterstrategie und integriert diese in einen Filteragenten. Wie die vorhandenen Informationen genutzt werden, um eine erfolgreiche Filterstrategie zu entwickeln, ist Gegenstand der konzeptuellen Arbeit einer jeden Gruppe.

 

Die Lösungen der Arbeitsgruppen fließen also ein eine Community von Filteragenten ein. Außerdem werden die aus dem Projekt resultierenden Filter-Agenten in Form einer Competition gegeneinander antreten, indem die Resultate auf gleiche Anfragen verglichen werden. In die Bewertung fließen auch Originalität, Ressourcenverbrauch und Geschwindigkeit der Agenten mit ein.

 

Lernziele

  • Vertiefung der theoretischen Grundlagen: Sie erlernen die Nutzung der Agententechnolo­gie in verteilten kooperativen Systemen. Dabei wenden Sie Methoden der verteilten künst­lichen Intelligenz an und lernen deren Stärken und Schwächen kennen.
  • Methodik: Es erfolgt eine Einarbeitung in die am Fachgebiet AOT entwickelte Agentenplatt­form JIAC. Außerdem wird eine strukturierte Vorgehensweise beim Entwurf verteilter Anwendungen vermittelt und praktisch angewendet. Vefahren der Informationsverarbeitung, -filterung und -aufbereitung werden vertieft.
  • Teamarbeit: Eine zielgerichtete Koordination der Teammitglie­der ist unabdingbar, um das Projekt erfolgreich abschließen zu können. Hierzu werden Ihnen grundlegende Techniken des Projektmanagements und -controllings vermittelt. In Projektsitzungen koordinieren sich die Arbeitsgruppen untereinander.
  • Dokumentation und Präsentation von Ergebnissen stellen weitere Schwerpunkte dar.
  • Beim Arbeiten mit der Architektur erlernt und verbessert der Teilnehmer den Umgang mit: Eclipse , Java 1.5, Maven 2
  • Die Versions-Kontrolle erfolgt über Subversion (SVN) und wird per Cruisecontrol überwacht.

Semesterplanung

Was werden wir zusammen machen?

Wir haben eine bestehende Agenten-Community. Diese ist voll funktionsfähig, bis auf eine Tatsache: Die Filter-Agenten implementieren zwar alle das gleiche Interface, sind aber im Grunde leer. Aufgabe ist es, einen solchen Filter-Agenten mit einer Filter-Strategie zu füllen. Welche Strategien es gibt, werdet ihr im Seminarteil am Anfang des Projektes erfahren.
Der Clou an der ganzen Sache ist der Filter-Manager. Den haben wir entwickelt. Er erkennt, welche Agenten in welchen Situationen gute Arbeit leisten und geleistet haben. Auf dieser Basis wählt er bei Anfragen die Filter-Agenten aus, die die höchste Qualität versprechen. Wählt er euren Filter-Agenten bevorzugt aus, ist das schon ein guter Indiz für die Benotung des Implementations-Teils. Aber auch Filter-Agenten, die in speziellen Nischen (Query-Arten und System-Zustände) gute Resultate liefern, sind der Community äußerst dienlich. Tritt nämlich eine solche Situation ein, wo dieser Agent besser ist als alle anderen, wird er ausgewählt die Filter-Anfrage zu bearbeiten und erhöht somit die Qualität der gesamten Community.

Das folgende Bild zeigt, wie sich verschiedene Filter-Strategien unterstützen, um die Gesamt-Qualität zu erhöhen:

Datum Art   Thema/Inhalt
25.04. LV   Einführung und Ãœberblick
02.05. SE   Seminarvorträge: Preprocessing / Indexing
09.05. SE   Seminarvorträge: Contentbased Filtering / Collaborative Filtering
16.05. SE   Seminarvorträge: Benchmarking / Clustering
23.05. LV   Einführung in die Architektur
30.05. UE   Rückfragen, Hilfen
06.06. VL   Meilenstein 1: Einfache Filterung im File-System
13.06. SE   Präsentation der geplanten Filterstrategien
20.06. UE   Rückfragen, Hilfen
27.06. VL   Meilenstein 2: Strategische Filterung auf Webseiten
04.07. UE   Rückfragen, Hilfen
11.07. UE   Rückfragen, Hilfen
18.07. SE   Meilenstein 3 / Competition / Vorstellung des Abschlussberichts
       
LV : Lehrveranstaltungsteil      
SE: Seminarteil      
UE: Ãœbungsteil / Diskussion      

Bei entsprechender Teilnehmerzahl werden weitere notwendige Termine außerhalb zu den angesetzten Terminen vereinbart. Es ist dringend notwendig, dass die Vorträge in der dritten Woche abgeschlossen sind.

Voraussetzungen

  • Abgeschlossenes Vordiplom in Informatik oder einer verwandten Studienrichtung
  • Hilfreich sind Kenntnisse aus den Vorlesungen Grundlagen der Künstlichen Intelligenz und Maschinelles Lernen
  • Grundlegendes Verständnis der Objektorientierten Programmierung und Java-Kenntnisse 

Prüfungsmodalitäten, Anforderungen

Diese Lehrveranstaltung kann in eine Prüfung in den Bereichen KI, BKS und WVA eingebracht werden.

Ansprechpartner