Modul (Bachelor)
Web-Technologien und Information Retrieval (BA-INF 111)
Dr. Melanie Gnasa Dr. Stefan Lüttringhaus-Kappel
Diese Vorlesung ist eine Wahlpflichtveranstaltung im Studiengang B.Sc. Informatik im 5. Semester. Die Vorlesung kann auch im Hauptstudium des Diplomstudiengangs Informatik angerechnet werden.
Das klassische World Wide Web hat (WWW) drei Komponenten: Adressen (URI), Transport (HTTP) und Inhalte (u.a. HTML). Die ersten beiden Punkte werden zu Beginn der Vorlesung kurz behandelt. Zentral für die Darstellung und Verarbeitung der Inhalte im WWW sind XML-Technologien, diese werden im ersten Teil der Vorlesung ausführlich behandelt. Die Themen im Einzelnen: XML-Dokumente, XML Namespaces, XML Information Set, XML Schema, XML Path Language (XPath 2.0), XSL Transformations (XSLT 2.0), Programmierschnittstellen (am Beispiel Java): SAX, DOM, XML-Datenbanken und Anfragesprachen: XQuery und XUpdate; sowie eine kleine Auswahl von weiteren XML-Anwendungssprachen.
Im Information Retrieval werden Techniken untersucht, mittels derer einem Informations-Nachfragenden für ihn relevante Informationen bereitgestellt werden können. Charakteristisch sind hierbei die Vagheit der Anfragen ("Ich interessiere mich für Literatur zum Thema ..."), die Unschärfe des Matchings zwischen Anfragen und Dokumenten ("Relevanz"), wie auch die iterative Reformulierung von Anfragen. Die zugrundeliegende Informationssammlung kann ein Bibliothekskatalog sein, eine Sammlung von Volltexten, das Internet oder auch eine technisch-wissenschaftliche Datenbank. Die Vorlesung stellt Retrieval-Modelle vor, innerhalb derer Anfragen formuliert und Dokumente bezüglich ihrer Anfragerelevanz beurteilt werden können (Boolesches Retrieval, Vektorraummodell, und Probabilistisches Retrieval). Zur Bewertung der Eignung eines IR-Systems für eine spezielle Anwendung ist neben der Effizienz auch die Effektivität zu betrachten. Die Vorlesung stellt Methoden vor, mit denen unterschiedliche Retrieval-Systeme bezüglich der Unterstützung, die sie dem Benutzer bei seiner Suche bieten, bewertet und verglichen werden können.
Übung: Theoretische Vertiefung; praktische Arbeit mit Open-Source-Werkzeugen;
auch Programmieraufgaben in selbstorganisierten Kleingruppen.
Die erfolgreiche Bearbeitung der wöchentlich gestellten Übungsaufgaben
ist Voraussetzung zur Zulassung zur Leistungspunkteprüfung.
| Zeit, Ort | Mo, Mi 9-11 HS A207 |
| Semesterwochenstunden | 4V + 2Ü |
| Beginn | Mi. 17.10.2007 |
| Übungen | Do 17-19, HS A207 (Dr. Melanie Gnasa, Dr. Stefan Lüttringhaus-Kappel, Frank Reichartz) |
| Voraussetzungen | Grundlegende Java-Kenntnisse |
| Email-Kontakt | stefan@iai.uni-bonn.de |
| Literatur | Elliotte R. Harold, W. Scott Means: XML in a Nutshell. 3. Auflage, O'Reilly, englisch (2004) oder deutsch (2005)
Reginald Ferber, Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web. dpunkt.verlag, 2003
Christopher D. Manning, Praghakar Raghavan, Hinrich Schütze: Introduction to Information Retrieval. Cambridge University Press, to appear (2007)
Weitere Literaturangaben folgen in der Vorlesung. |
|