Information Filtering Services (Kopie 1)
Modul: | BINF-SWT-SE.S08 |
Semester: | Sommersemester 2008 |
Art: | PJ (6 SWS / 6 LP) |
LV-Nr.: | 0435 L 734 |
Veranstalter: | Albayrak |
Zeit: | Dienstag 12 - 14 |
Raum: | A 052 |
Beginn: | 22.04.2008 |
Teilnehmerzahl: | maximal 20 Studierende |
Beschreibung
Do you know PIA? PIA ist eine Suchmaschine zur Unterstützung euer Literatur-Recherchen. Sie findet wissenschaftliche Papiere von ACM und IEEE. Ihr werdet helfen, sie zu verbessern.
Kamt ihr schon mal an den Punkt, wo ihr euch über eine Suchmaschine geärgert habt, weil sie eine Funktion nicht angeboten hat, die euch in diesem Moment weiter geholfen hätte? Information Filtering Services dienen dazu, den Benutzer nach einer Suche nicht alleine zu lassen sondern ihm mit intelligenter Unterstützung zu helfen, zu noch informativeren Resultaten zu gelangen. Zu den derzeit implementierten Services in PIA gehören eine Tag-Cloud welche relevante Keywords vorschlägt die dann in das Suchfeld gezogen werden können, sowie ein Clustering zum Eingrenzen der angezeigten Dokumentenliste und ein Service, der passend zur aktuellen Anfrage und individuellen Vorlieben andere Suchen vorschlägt. Damit soll aber noch lange nicht Schluss sein.
Im Projekt Information Filtering Services werdet ihr weitere Services entwickeln, die
- die Präsentation der Ergebnisse verändern
- die Formulierung der Such-Anfragen verbessern
- die Nutzung der zur Verfügung stehenden Services individualisieren
- Wissen über andere Benutzer nutzen
- Verlinkungen der Autoren, bzw. der Zitierungen visualisieren
- Avatare nutzen, um den Benutzer zu führen
- Avatare nutzen, um mit ihnen zu interagieren um Informationen einzuholen, die zum Individualisieren der Suche genutzt werden können
- das Verwalten eigener Suchen, Dokumente, Freunde vereinfachen
Die grundlegenden Kenntnisse in der Benutzung von JSPs, die zur Visualisierung der Services dienen, werden euch vermittelt. HTML-Code, sowie Flash-Elemente können integriert werden, falls ihr damit schon Erfahrung habt. Zur Verarbeitung der Daten, die für euren Service gebraucht werden, setzen wir Java ein.
Im Projekt wird viel Wert auf Qualität gelegt. Hierfür überprüfen wir euren Code kontinuierlich mittels Continuum und erstellen Report-Seiten, die Informationen über die Code-Qualität, Fehler und Dokumentation geben. Es gibt ein Bug-Tracking-System, welches derzeitige Fehler erfasst und protokolliert. Wir nutzen Maven, um unsere Java-Projekte zu builden und zu deployen.
Für eure Entwicklungen wird es ein eigenständiges Test-System geben, welches von euch genutzt werden kann, um Bugs zu finden und um euch über noch mehr Möglichkeiten zu informieren, welche weiteren Information Filtering Services angeboten werden können.
Lernziele
- Überblick über verschiedene Filterungsverfahren
- Anwendung maschineller Lernenverfahren
- Konzipierung und Implementierung intelligenter Filterstrategien
- Teamarbeit, Literaturrecherche und Dokumentation, mündliche Präsentation
Semesterplanung
Dieses Projekt behandelt aktuelle Themen aus dem Gebiet der Informationsfilterung: Neuronale Netze, Entscheidungsbäume, Indexierungsverfahren, Datamining, Bayes’sche Inferenz sowie intelligente Kombination der verschiedenen Filterungsverfahren und Merkmalsextraktion. Die Teilnahme am Projekt bietet den Studierenden die Möglichkeit, durch die Umsetzung der Filterungsverfahren innerhalb eines klar umgrenzten Themas die Methodik des wissenschaftlichen Arbeitens kennen zu lernen. Dazu gehören Literaturrecherche, wissenschaftlicher Vortrag, Präsentationserstellung und Umsetzung von Filterungsverfahren.
Zu Beginn des Projekts werden die Inhalte zunächst in Seminarvorträgen erarbeitet. Nach dieser Analyse folgen Design und Implementation ausgewählter Information Filterung Services hinsichtlich der Integration in PIA. Abgeschlossen wird das Projekt durch eine Präsentation und einer Dokumentation.
Datum | Art | Thema/Inhalt |
22.04.2008 | LV | Einführung und Überblick |
29.04.2008 | LV | Web-Prgrammierung - Java Server Pages und co. |
06.05.2008 | SE | State of the Art - Was machen die anderen? |
SE | Information Filtering - Die Kunst eine Dokumenten-Menge zu verkleinern. | |
13.05.2008 | SE | WEBSOM und co. - Visualisierung maschineller Lernverfahren |
SE | ||
20.05.2008 | SE | |
SE | ||
27.05.2008 | LV | Implementierung von Information Filtering Services in PIA - Eine Einführung und Hilfestellung |
UE | Vergabe der Information Filtering Services an die Gruppen | |
03.06.2008 | UE | Rückfragen, Hilfen |
10.06.2008 | UE | Rückfragen, Hilfen |
17.06.2008 | SE | Meilenstein 1: Konzeptionelles Design der Filterungsverfahren |
24.06.2008 | UE | Rückfragen, Hilfen |
01.07.2008 | UE | Rückfragen, Hilfen |
08.07.2008 | UE | Rückfragen, Hilfen |
15.07.2008 | SE | Meilenstein 2: Vorstellung der implementierten Filterungsverfahren, Abschlussberichte |
- LV : Lehrveranstaltungsteil
- SE: Seminarteil
- UE: Ãœbungsteil / Diskussion
Bei entsprechender Teilnehmerzahl werden weitere notwendige Termine außerhalb zu den angesetzten Terminen vereinbart. Es ist dringend notwendig, dass die Vorträge mit dem 20.05. abgeschlossen sind.
Voraussetzungen
- Abgeschlossenes Vordiplom der Informatik oder einer verwandten Studienrichtung
- Hilfreich sind Kenntnisse aus den Vorlesungen Grundlagen der Künstlichen Intelligenz und Maschinelles Lernen
- Grundlegendes Verständnis der Objektorientierten Programmierung und Java-Kenntnisse
Prüfungsmodalitäten, Anforderungen
Diese Lehrveranstaltung kann von Diplom-Studierenden in eine Prüfung in den Bereichen KI, BKS und WVA eingebracht werden.
Als Bestandteil des Moduls BINF-SWT-SE.S08 ist diese Lehrveranstaltung folgendermaßen in Informatik und Technische Informatik eingeordnet:
- Informatik Bachelor: Studienschwerpunkt Softwaretechnik
- TI Bachelor: Fachstudium Informatik
Literatur
- Information Filtering: The Computation of Similarities in Large Corpora of Legal Texts
Erich Schweighofer, Werner Winiwarter, Dieter Merkl - Suche mit Sinn und Verstand (Technology Review März 2008)
Ralf Grötiker - WEBSOM
Teuvo Kohonen et al. - Wie arbeiten die Suchmaschinen von morgen?
Friedemann Mattern
Related Sites
Ansprechpartner
Copyright TU Berlin 2007