PJ Information Retrieval Projekt
Information Retrieval Projekt
Semester: | Sommersemester 2006 |
Art: | PJ6 |
LV-Nr.: | 0435 L 724 |
Veranstalter: | Albayrak |
Zeit: | Dienstag, 10:00 - 12:00 Uhr im GOR 109 (Salzufer 12) |
(Bei Bedarf kann auch ein anderer Termin vereinbart werden) | |
Erster Termin: | 25.04.2006 |
Teilnehmerzahl: | maximal 20 Studierende |
Beschreibung
Information Retrieval ist ein bedeutendes Forschungsgebiet der Informatik. Das Herausfiltern von relevanten Informationen aus verschiedenen Datenquellen stellt im Hinblick auf die Fülle irrelevanter Information im Internet zu eine nicht triviale Aufgabe dar.
Grundlage für dieses Projekt ist ein umfangreicher Dokumenten-Korpus und eine Infrastruktur für informationsfilternde Agenten. Das übergeordnete Projektziel besteht nun darin, eine Community von Filteragenten zu entwickeln, die, ausgestattet mit unterschiedlichen Filterstrategien und -fähigkeiten, Suchanfragen an den vorhandenen Dokumenten-Korpus möglichst exakt und effizient zu beantworten. Hierzu konzipiert und entwickelt jede Arbeitsgruppe (3-4 Studierende) einen Filterstrategie und integriert diese in einen Filteragenten. Wie die vorhandenen Informationen genutzt werden, um eine erfolgreiche Filterstrategie zu entwickeln, ist Gegenstand der konzeptuellen Arbeit einer jeden Gruppe.
Die Lösungen der Arbeitsgruppen fließen also ein eine Community von Filteragenten ein. Außerdem werden die aus dem Projekt resultierenden Filter-Agenten in Form einer Competition gegeneinander antreten, indem die Resultate auf gleiche Anfragen verglichen werden. In die Bewertung fließen auch Originalität, Ressourcenverbrauch und Geschwindigkeit der Agenten mit ein.
Lernziele
- Vertiefung der theoretischen Grundlagen: Sie erlernen die Nutzung der AgententechnoloÂgie in verteilten kooperativen Systemen. Dabei wenden Sie Methoden der verteilten künstÂlichen Intelligenz an und lernen deren Stärken und Schwächen kennen.
- Methodik: Es erfolgt eine Einarbeitung in die am Fachgebiet AOT entwickelte AgentenplattÂform JIAC. Außerdem wird eine strukturierte Vorgehensweise beim Entwurf verteilter Anwendungen vermittelt und praktisch angewendet. Vefahren der Informationsverarbeitung, -filterung und -aufbereitung werden vertieft.
- Teamarbeit: Eine zielgerichtete Koordination der TeammitglieÂder ist unabdingbar, um das Projekt erfolgreich abschließen zu können. Hierzu werden Ihnen grundlegende Techniken des Projektmanagements und -controllings vermittelt. In Projektsitzungen koordinieren sich die Arbeitsgruppen untereinander.
- Dokumentation und Präsentation von Ergebnissen stellen weitere Schwerpunkte dar.
- Beim Arbeiten mit der Architektur erlernt und verbessert der Teilnehmer den Umgang mit: Eclipse , Java 1.5, Maven 2
- Die Versions-Kontrolle erfolgt über Subversion (SVN) und wird per Cruisecontrol überwacht.
Semesterplanung
Was werden wir zusammen machen?
Wir haben eine bestehende Agenten-Community. Diese ist voll funktionsfähig, bis auf eine Tatsache: Die Filter-Agenten implementieren zwar alle das gleiche Interface, sind aber im Grunde leer. Aufgabe ist es, einen solchen Filter-Agenten mit einer Filter-Strategie zu füllen. Welche Strategien es gibt, werdet ihr im Seminarteil am Anfang des Projektes erfahren.
Der Clou an der ganzen Sache ist der Filter-Manager. Den haben wir entwickelt. Er erkennt, welche Agenten in welchen Situationen gute Arbeit leisten und geleistet haben. Auf dieser Basis wählt er bei Anfragen die Filter-Agenten aus, die die höchste Qualität versprechen. Wählt er euren Filter-Agenten bevorzugt aus, ist das schon ein guter Indiz für die Benotung des Implementations-Teils. Aber auch Filter-Agenten, die in speziellen Nischen (Query-Arten und System-Zustände) gute Resultate liefern, sind der Community äußerst dienlich. Tritt nämlich eine solche Situation ein, wo dieser Agent besser ist als alle anderen, wird er ausgewählt die Filter-Anfrage zu bearbeiten und erhöht somit die Qualität der gesamten Community.
Das folgende Bild zeigt, wie sich verschiedene Filter-Strategien unterstützen, um die Gesamt-Qualität zu erhöhen:
Datum | Art | Thema/Inhalt | |
25.04. | LV | Einführung und Überblick | |
02.05. | SE | Seminarvorträge: Preprocessing / Indexing | |
09.05. | SE | Seminarvorträge: Contentbased Filtering / Collaborative Filtering | |
16.05. | SE | Seminarvorträge: Benchmarking / Clustering | |
23.05. | LV | Einführung in die Architektur | |
30.05. | UE | Rückfragen, Hilfen | |
06.06. | VL | Meilenstein 1: Einfache Filterung im File-System | |
13.06. | SE | Präsentation der geplanten Filterstrategien | |
20.06. | UE | Rückfragen, Hilfen | |
27.06. | VL | Meilenstein 2: Strategische Filterung auf Webseiten | |
04.07. | UE | Rückfragen, Hilfen | |
11.07. | UE | Rückfragen, Hilfen | |
18.07. | SE | Meilenstein 3 / Competition / Vorstellung des Abschlussberichts | |
LV : Lehrveranstaltungsteil | |||
SE: Seminarteil | |||
UE: Übungsteil / Diskussion |
Bei entsprechender Teilnehmerzahl werden weitere notwendige Termine außerhalb zu den angesetzten Terminen vereinbart. Es ist dringend notwendig, dass die Vorträge in der dritten Woche abgeschlossen sind.
Voraussetzungen
- Abgeschlossenes Vordiplom in Informatik oder einer verwandten Studienrichtung
- Hilfreich sind Kenntnisse aus den Vorlesungen Grundlagen der Künstlichen Intelligenz und Maschinelles Lernen
- Grundlegendes Verständnis der Objektorientierten Programmierung und Java-Kenntnisse
Prüfungsmodalitäten, Anforderungen
Diese Lehrveranstaltung kann in eine Prüfung in den Bereichen KI, BKS und WVA eingebracht werden.
Ansprechpartner
Copyright TU Berlin 2007