direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Logo der TU Berlin

Information Filtering Services (Kopie 1)

Modul: BINF-SWT-SE.S08
Semester: Sommersemester 2008
Art: PJ (6 SWS / 6 LP)
LV-Nr.: 0435 L 734
Veranstalter: Albayrak
Zeit: Dienstag 12 - 14
Raum: A 052
Beginn: 22.04.2008
Teilnehmerzahl: maximal 20 Studierende

Beschreibung

Do you know PIA? PIA ist eine Suchmaschine zur Unterstützung euer Literatur-Recherchen. Sie findet wissenschaftliche Papiere von ACM und IEEE. Ihr werdet helfen, sie zu verbessern.

 

Kamt ihr schon mal an den Punkt, wo ihr euch über eine Suchmaschine geärgert habt, weil sie eine Funktion nicht angeboten hat, die euch in diesem Moment weiter geholfen hätte? Information Filtering Services dienen dazu, den Benutzer nach einer Suche nicht alleine zu lassen sondern ihm mit intelligenter Unterstützung zu helfen, zu noch informativeren Resultaten zu gelangen. Zu den derzeit implementierten Services in PIA gehören eine Tag-Cloud welche relevante Keywords vorschlägt die dann in das Suchfeld gezogen werden können, sowie ein Clustering zum Eingrenzen der angezeigten Dokumentenliste und ein Service, der passend zur aktuellen Anfrage und individuellen Vorlieben andere Suchen vorschlägt. Damit soll aber noch lange nicht Schluss sein.

 

Im Projekt Information Filtering Services werdet ihr weitere Services entwickeln, die

  • die Präsentation der Ergebnisse verändern
  • die Formulierung der Such-Anfragen verbessern
  • die Nutzung der zur Verfügung stehenden Services individualisieren
  • Wissen über andere Benutzer nutzen
  • Verlinkungen der Autoren, bzw. der Zitierungen visualisieren
  • Avatare nutzen, um den Benutzer zu führen
  • Avatare nutzen, um mit ihnen zu interagieren um Informationen einzuholen, die zum Individualisieren der Suche genutzt werden können
  • das Verwalten eigener Suchen, Dokumente, Freunde vereinfachen

 

 

Momentante Information Filtering Services in PIA (links) und die Vision des PIA mit Abschluss des Projekts (rechts).

 

 

Die grundlegenden Kenntnisse in der Benutzung von JSPs, die zur Visualisierung der Services dienen, werden euch vermittelt. HTML-Code, sowie Flash-Elemente können integriert werden, falls ihr damit schon Erfahrung habt. Zur Verarbeitung der Daten, die für euren Service gebraucht werden, setzen wir Java ein.

 

Im Projekt wird viel Wert auf Qualität gelegt. Hierfür überprüfen wir euren Code kontinuierlich mittels Continuum und erstellen Report-Seiten, die Informationen über die Code-Qualität, Fehler und Dokumentation geben. Es gibt ein Bug-Tracking-System, welches derzeitige Fehler erfasst und protokolliert. Wir nutzen Maven, um unsere Java-Projekte zu builden und zu deployen.

 

Für eure Entwicklungen wird es ein eigenständiges Test-System geben, welches von euch genutzt werden kann, um Bugs zu finden und um euch über noch mehr Möglichkeiten zu informieren, welche weiteren Information Filtering Services angeboten werden können.



Lernziele

  • Ãœberblick über verschiedene Filterungsverfahren
  • Anwendung maschineller Lernenverfahren
  • Konzipierung und Implementierung intelligenter Filterstrategien
  • Teamarbeit, Literaturrecherche und Dokumentation, mündliche Präsentation

Semesterplanung

Dieses Projekt behandelt aktuelle Themen aus dem Gebiet der Informationsfilterung: Neuronale Netze, Entscheidungsbäume, Indexierungsverfahren, Datamining, Bayes’sche Inferenz sowie intelligente Kombination der verschiedenen Filterungsverfahren und Merkmalsextraktion. Die Teilnahme am Projekt bietet den Studierenden die Möglichkeit, durch die Umsetzung der Filterungsverfahren innerhalb eines klar umgrenzten Themas die Methodik des wissenschaftlichen Arbeitens kennen zu lernen. Dazu gehören Literaturrecherche, wissenschaftlicher Vortrag, Präsentationserstellung und Umsetzung von Filterungsverfahren.

Zu Beginn des Projekts werden die Inhalte zunächst in Seminarvorträgen erarbeitet. Nach dieser Analyse folgen Design und Implementation ausgewählter Information Filterung Services hinsichtlich der Integration in PIA. Abgeschlossen wird das Projekt durch eine Präsentation und einer Dokumentation.

 

Datum Art Thema/Inhalt
22.04.2008 LV Einführung und Überblick
29.04.2008 LV Web-Prgrammierung - Java Server Pages und co.
06.05.2008 SE State of the Art - Was machen die anderen?
  SE Information Filtering - Die Kunst eine Dokumenten-Menge zu verkleinern.
13.05.2008 SE WEBSOM und co. - Visualisierung maschineller Lernverfahren
  SE  
20.05.2008 SE  
  SE  
27.05.2008 LV Implementierung von Information Filtering Services in PIA - Eine Einführung und Hilfestellung
  UE Vergabe der Information Filtering Services an die Gruppen
03.06.2008 UE Rückfragen, Hilfen
10.06.2008 UE Rückfragen, Hilfen
17.06.2008 SE Meilenstein 1: Konzeptionelles Design der Filterungsverfahren
24.06.2008 UE Rückfragen, Hilfen
01.07.2008 UE Rückfragen, Hilfen
08.07.2008 UE Rückfragen, Hilfen
15.07.2008 SE Meilenstein 2: Vorstellung der implementierten Filterungsverfahren, Abschlussberichte
  • LV : Lehrveranstaltungsteil
  • SE: Seminarteil
  • UE: Ãœbungsteil / Diskussion

 

Bei entsprechender Teilnehmerzahl werden weitere notwendige Termine außerhalb zu den angesetzten Terminen vereinbart. Es ist dringend notwendig, dass die Vorträge mit dem 20.05. abgeschlossen sind.

Voraussetzungen

  • Abgeschlossenes Vordiplom der Informatik oder einer verwandten Studienrichtung
  • Hilfreich sind Kenntnisse aus den Vorlesungen Grundlagen der Künstlichen Intelligenz und Maschinelles Lernen
  • Grundlegendes Verständnis der Objektorientierten Programmierung und Java-Kenntnisse 

Prüfungsmodalitäten, Anforderungen

Diese Lehrveranstaltung kann von Diplom-Studierenden in eine Prüfung in den Bereichen KI, BKS und WVA eingebracht werden.

Als Bestandteil des Moduls BINF-SWT-SE.S08 ist diese Lehrveranstaltung folgendermaßen in Informatik und Technische Informatik eingeordnet:

  • Informatik Bachelor: Studienschwerpunkt Softwaretechnik
  • TI Bachelor: Fachstudium Informatik

Literatur

 

Related Sites

Ansprechpartner