Institut für Informatik
Rheinische Friedrich-Wilhelms-Universität Bonn


Index
Institut
Forschung
Lehre und Studium
DV-Dienste
Bibliothek
Fachschaft
 
Lehrveranstaltungen
Prüfungsangelegenheiten
Studienberatung
Kommission für Lehre und Studium
Vorlesungszeiten
Up:Übersicht: alle Semester
Up:Wintersemester 2007/08
Prev.:Grundlagen der Künstlichen Intelligenz (BA-INF 110) (4V+2Ü)
Di, Do 13-15, HS A207 (Dr. Dirk Schulz)
Übungen: n.Vereinb. (Dr. Simone Frintrop)
Next.:Grundlagen der digitalen Signalverarbeitung (BA-INF 112) (4V+2Ü)
Mi, Fr 9-11, HS1 (Prof. Dr. Michael Clausen)
Übungen: Fr 11-13, HS A, SR A121 (Prof. M. Clausen)


Modul (Bachelor)

Web-Technologien und Information Retrieval (BA-INF 111)

Dr. Melanie Gnasa
Dr. Stefan Lüttringhaus-Kappel

Diese Vorlesung ist eine Wahlpflichtveranstaltung im Studiengang B.Sc. Informatik im 5. Semester. Die Vorlesung kann auch im Hauptstudium des Diplomstudiengangs Informatik angerechnet werden.

Das klassische World Wide Web hat (WWW) drei Komponenten: Adressen (URI), Transport (HTTP) und Inhalte (u.a. HTML). Die ersten beiden Punkte werden zu Beginn der Vorlesung kurz behandelt. Zentral für die Darstellung und Verarbeitung der Inhalte im WWW sind XML-Technologien, diese werden im ersten Teil der Vorlesung ausführlich behandelt. Die Themen im Einzelnen: XML-Dokumente, XML Namespaces, XML Information Set, XML Schema, XML Path Language (XPath 2.0), XSL Transformations (XSLT 2.0), Programmierschnittstellen (am Beispiel Java): SAX, DOM, XML-Datenbanken und Anfragesprachen: XQuery und XUpdate; sowie eine kleine Auswahl von weiteren XML-Anwendungssprachen.

Im Information Retrieval werden Techniken untersucht, mittels derer einem Informations-Nachfragenden für ihn relevante Informationen bereitgestellt werden können. Charakteristisch sind hierbei die Vagheit der Anfragen ("Ich interessiere mich für Literatur zum Thema ..."), die Unschärfe des Matchings zwischen Anfragen und Dokumenten ("Relevanz"), wie auch die iterative Reformulierung von Anfragen. Die zugrundeliegende Informationssammlung kann ein Bibliothekskatalog sein, eine Sammlung von Volltexten, das Internet oder auch eine technisch-wissenschaftliche Datenbank. Die Vorlesung stellt Retrieval-Modelle vor, innerhalb derer Anfragen formuliert und Dokumente bezüglich ihrer Anfragerelevanz beurteilt werden können (Boolesches Retrieval, Vektorraummodell, und Probabilistisches Retrieval). Zur Bewertung der Eignung eines IR-Systems für eine spezielle Anwendung ist neben der Effizienz auch die Effektivität zu betrachten. Die Vorlesung stellt Methoden vor, mit denen unterschiedliche Retrieval-Systeme bezüglich der Unterstützung, die sie dem Benutzer bei seiner Suche bieten, bewertet und verglichen werden können.

Übung: Theoretische Vertiefung; praktische Arbeit mit Open-Source-Werkzeugen; auch Programmieraufgaben in selbstorganisierten Kleingruppen. Die erfolgreiche Bearbeitung der wöchentlich gestellten Übungsaufgaben ist Voraussetzung zur Zulassung zur Leistungspunkteprüfung.

Zeit, OrtMo, Mi 9-11 HS A207
Semesterwochenstunden4V + 2Ü
BeginnMi. 17.10.2007
ÜbungenDo 17-19, HS A207 (Dr. Melanie Gnasa, Dr. Stefan Lüttringhaus-Kappel, Frank Reichartz)
VoraussetzungenGrundlegende Java-Kenntnisse
Email-Kontaktstefan@iai.uni-bonn.de
LiteraturElliotte R. Harold, W. Scott Means: XML in a Nutshell. 3. Auflage, O'Reilly, englisch (2004) oder deutsch (2005)

Reginald Ferber, Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web. dpunkt.verlag, 2003

Christopher D. Manning, Praghakar Raghavan, Hinrich Schütze: Introduction to Information Retrieval. Cambridge University Press, to appear (2007)

Weitere Literaturangaben folgen in der Vorlesung.

  Uni-Bonn - Math-Nat - Informatik   -   I   II   III   IV   V   VI

Wobmaster - The Wob