Institut für Informatik
Rheinische Friedrich-Wilhelms-Universität Bonn


Index
Institut
Forschung
Lehre und Studium
DV-Dienste
Bibliothek
Fachschaft
 
Lehrveranstaltungen
Prüfungsangelegenheiten
Studienberatung
Kommission für Lehre und Studium
Vorlesungszeiten
Up:Informatik III - alle Semester
Up:Wintersemester 2001/02
Prev.:Grundlagen der Künstlichen Intelligenz (4V+2Ü) (B,C)
Mi 9-11, Fr 9-11, HS 1 (Prof. Dr. J. Buhmann, Prof. Dr. A. B. Cremers)
Übungen: Mo 15-17, R A 121 (Prof. Dr. J. Buhmann, J. Schumacher)
Next.:Schnelle Fouriertransformation (2V) (A)
Mo 12-14, HS C (Prof. Dr. M. Clausen)


Vorlesung (Hauptstudium)

Digitale Bildverarbeitung und Computersehen I

Prof. Dr. J. Buhmann

Bildverarbeitung und Computersehen ist ein Teilgebiet der Informatik, das sich mit der Extraktion von Objektinformation aus Bildern beschaeftigt. Klassische Methoden zur Kantenextraktion, zur Bewegungsschaetzung, zur Stereoextraktion, zur Beleuchtungsschaetzung und zur Texturklassifikation werden vorgestellt. Active vision und Bildsequenzenverarbeitung sollen ausfuehrlich diskutiert werden. Der Schwerpunkt der Vorlesung liegt bei early (low level) vision und mathematischen Methoden wie Markov random fields und Auflösungspyramiden.

Zeit, OrtMo 9-11, HS 1, Di 9-11, HS A 207
Semesterwochenstunden3V + 2Ü
Beginn15.10.2001
ÜbungenMo 13-15, R A 121 (Prof. Dr. J. Buhmann, L. Hermes)
VoraussetzungenAnalysis I/II,
Lineare Algebra I/II,
Interesse an mathematischer Modellierung
Nachfolgeveranstaltungen Digitale Bildverarbeitung und Computersehen II im SS 2002
Bereich (alte DPO)B,C
LiteraturV. S. Nalwa: A Guided Tour of Computer Vision, Addison Wesley, 1993
B. K. Horn: Robot Vision, MIT Press, 1986
B. Jähne: Digitale Bildverarbeitung, Springer, 1997
O. Faugeras: Three-Dimensional Computer Vision - A Geometric Viewpoint, MIT Press, 1993

Übungsblätter

Diese Vorlesung bietet die Möglichkeit, durch eine erfolgreiche Bearbeitung der Übungsaufgaben einen Übungsschein zu erwerben. Auf Wunsch kann dieser Schein auch benotet ausgestellt werden.

  • Übungsblatt 1 - Abgabe 29. Oktober 2001
  • Übungsblatt 2 - Abgabe 5. November 2001
  • Übungsblatt 3 - Abgabe 12. Oktober 2001, zugehörige Bilder - bitte unter Solaris entpacken durch "tar -xzvf Blatt03.bilder.tgz"
  • Übungsblatt 4 - Abgabe 19. November 2001
  • Übungsblatt 5 - Abgabe 26. November 2001
  • Übungsblatt 6 - Abgabe 3. Dezember 2001
  • Übungsblatt 7 - Abgabe 10. Dezember 2001
  • Übungsblatt 8 - Abgabe 17. Dezember 2001
  • Übungsblatt 9 - Abgabe 7. Januar 2002
  • Übungsblatt 10 - Abgabe 21. Januar 2002
  • Übungsblatt 11 - Abgabe 28. Januar 2002
  • Übungsblatt 12 - Abgabe 4. Februar 2002
  • Folien

    Die in der Vorlesung verwendeten Folien werden schrittweise im PDF-Format auf dieser Seite verfügbar sein.

  • Gliederung
  • 15. Oktober 2001
  • 16. Oktober 2001
  • 22. Oktober 2001
  • 12./13. November 2001
  • 27. November 2001
  • 11. Dezember 2001
  • 28. Januar 2002 - Exkurs (Stereo-Matching)
  • Die Vorlesung in Stichworten

    I EINFÜHRUNG

    I.1 Motivation
    I.2 Bildentstehungsprozess
    I.3 Perspektivische Projektion, Lochkameramodell, homogene Koordinaten, Verzerrungen, Kalibrierung
    I.4 Linsen, Tiefennschärfe
    I.5 Bildaufnahme, Phototransistor, Fehlerquellen
    I.6 Rauscheinflüsse, Pixelrauschen, Poissonverteilung, Rauschmodelle ohne räumliche Korrelation
    I.7 Radiometrie: Beleuchungsdichte/Leuchtdichte, Bildentstehung

    II VERARBEITUNG RÄUMLICH STETIGER BILDER

    II.1 Fourierreihen, punktweise Konvergenz, Konvergenzvoraussetzungen, Satz von du Bois, stückw. Stetigkeit, Besselsche Ungleichung, Eindeutigkeit von Fourierkoeffizienten, orthogonale Funktionensysteme, verallgemeinerte Fourierreihen, Gibbs-Phänomen, komplexe Fourierkoeffizienten
    II.2 Kontinuierliche Fouriertransformation und Umkehrtransformation, Transformation einer Gaußglocke, Eigenschaften der Fouriertransformation (Linearität, Verschiebung, Skalierung, Modulation, Ableitung), Faltung im Orts- und Frequenzraum, Autokorrelation, Parsevalsche Gleichung, Schnelle Fouriertransformation (FFT) für 1- und 2-dim. Signale, Anwendung: Filterung und Kompression
    II.3 Bilder als kontinuierl. 2-dim. Funktionen, Bildverzerrung, lineare verschiebungsinvariante Systeme, Dirac-Funktion
    II.4 Faltung und Impulsantwort ( Point-Spread -Funktion), Beispiel: Defokussierung, atmosphärische Störungen, Kommutativität und Assoziativität der Faltungsoperation
    II.5 Modulationstransferfunktion, FT für rotationssymmetr. Kerne, naiver Tiefpass, verbesserter Tiefpasss, Bilddegradation: Bewegungsverschmierung, Bildrestauration
    II.6 Optimales lineares Filtern, SNR, Wienerfilter, Bildmodelle: Leistungsspektrum natürl. Bilder, räumlich unkorreliertes Rauschen, Signal-Rausch-Spektren, Wienerfilterung für Bildentrauschung und nachverarbeitete Bilder
    II.7 Mathematischer Exkurs: Variationsrechnung, Fundamentallemma der Variationsrechnung, Herleitung der Eulergleichung, Erweiterungen: Einbeziehung höherer Ableitungen, Nebenbedingungen, mehrdim. Variationsrechnung
    II.8 Nichtlineare Filterung, Median-Filter, SNR und Peak-SNR, Diffusionsfilter, Eigenschaften: Maxima-Erhaltung, keine Artefakte; Skalenraum-Prinzip; nichtlineare Diffusion: Perona-Malik-Modell

    III VERARBEITUNG DISKRETER BILDER

    III.1 Abtast-Theorem mit Beweis, Abtasten von Bildern (2D), Aliasing-Fehler, Tiefpassfilterung oder überlappende Sensoren als Gegenmaßnahme
    III.2 Grauwertquantisierung, Lloyd-Max-Quantisierer, Parameterintegrale (Exkurs), Vektorquantisierung: K-Means-Algorithmus, LBG-Algorithmus, Quantisierungsartefakte (Contouring), Kontrastquantisierung, Halbtonbilder ("Dithering"): Floyd-Steinberg-Dithering
    III.3: Farbquantisierung: Farbwahrnehmung, physikalischer vs. perzeptiver Farbraum, CIE-Raum, LAB-Farbraum, Farbquantisierung mit Dithering

    IV KANTENEXTRAKTION

    IV.1 Marr's Philosophie der Bildrepräsentation: Early Vision, Primal Sketch, 2 1/2 DSketch, 3 D Sketch, Problemformalisierung, Repräsentation und Algorithmik, Hardware-Umsetzung
    IV.2 Primal Sketch: Zero Crossings -> Raw Primal Sketch -> Full Primal Sketch
    IV.3 Kirsch-Templates, Sobel-Operatoren, Umgang mit Rauschen, Marr-Hildreth-Detektor
    IV.4 Canny-Detektor: Axiomatisierung, Herleitung nach Tagare und de Figueiredo. Eigenschaften des Canny-Detektors: Lokalisierung, Maximadichte. Alternative Herleitung des DoG-Filters über ein Lokalisierungskriterium. Rice-Formel. Canny-Detektor in 2D, Vergleich mit Marr-Hildreth.
    IV.5 Auflösungspyramiden. Parzellierung des Orts- und Frequenzraums. Idee von Wavelets und Wavepackets. Unschärferelation. Gauß-Laplace-Pyramide, Pyramiden-Algorithmus. Rekonstruktion. Koeffizientenzahl im Vergleich zu Wavelets.
    IV.6 Wavelet-Transformation. Unterschied zur gefensterten Foriertransformation. Dilatationsgleichung und Skalierungsfunktion. Orthonormalität. Haar-Wavelets. Daubechie-Wavelets. Gabor-Wavelets. Multiskalenanalyse, Axiomatik
    IV.7 Skalenräume. Lineare Theorie, Halbgruppeneigenschaft, Skaleninvarianz und Pi-Theorem, Isotropie. Bsp: Zero-Tree-Technik.

    V BEWEGUNGSEXTRAKTION

    V.1 Optischer Fluss und Bewegungsfeld. Korrespondenzproblem. Aperturproblem.
    V.2 Zwangsbedingung für den optischen Fluss. Glattheitsannahme. Kostenfunktional und Herleitung der Euler-Gleichung mit Randbedingung. Modifikationen bei diffus streuenden Objekten in parallelem/divergentem Licht, selbst leuchtenden Objekten, Glanzlichern. Bewegungsfelder bei speziellen Bewegungen.
    V.3 Schätzung des optischen Flusses im diskreten Fall. Diskretisierung der DGL -> Multi-Grid-Verfahren. Alternative: Diskretisierung des Kostenfunktionals -> Horn/Schunk. Geometrische Interpretation.
    V.4 Alternative Methoden: Differentielle Techniken (Nagel), Differentialgeometrische Modellierung (Jähne), kleinste Fehlerquadrate (Barron), flächenbasierte Zuordnungsverfahren (Kreuzkorrelationsverfahren), energiebasierte Verfahren (Heger), phasenbasierte Verfahren (Fleet/Jepson)

    VI STEREOSEHEN

    VI.1 Geometrie, Epipole, Korrespondenzproblem, Rekonstruktionsproblem
    VI.2 Epipolarbedingung, Kamerakalibrierung, Disparität, Messfehler, zyklopisches Auge
    VI.3 Grauwertzuordnung, Kostenfunktion aus Glattheit und Zuordnungsfehler, Euler-Lagrange-Gleichungen, biharmonischer Operator, Diskretisierung, grauwertbasierte und merkmalsbasierte Ansätze, Random-Dot-Stereogramme
    VI.4 Marr-Poggio-Algorithmus: Zwangsbedingungen (Eindeutigkeit, Glattheit), eindim. Retina, Netzdynamik, Disparitätsberechnung, fehlende Ljapunow-Funktion
    VI.5 "Verbotene Zone": Verletzung der Ordnung auf der Epipolarlinie; Stereosehen mittels dynamischer Programmierung
    VI.6 Intensitäts- und merkmalsbasiertes Stereo-Matching: Intensitätszwangsbedingung, Kostenfunktion nach Wei/Hirzinger, parametrische Disparitätskarte (RBF-Funktionen), Lernregel
    VI.7 Phasenbasierter Stereo-Algorithmus nach Fleet/Jepson: Gaborkoeffizienten, Phasendifferenz, Regularisierung (Taylorentwicklung)

    Weiterführende Informationen


  • Optischer Fluss nach Horn/Schunck - animierte Sequenz von Volker Gerdes
  • CV Online - Sammlung einführender Beiträge aus dem Bereich des maschinellen Sehens
  • Image Processing Fundamentals - interaktive Einführung in Grundlagen der Bildverarbeitung der TU Delft
  • Matlab-Code zur Gauß-Laplace-Pyramide - University of Pennsilvania
  • Matlab-Code zum Gibbs-Phänomen
  • Matlab-Code zur Gauß/Laplace-Filterung
  • Matlab-Code zum naiven Tiefpass-Filter
  • Matlab-Code zur Nichtlinearen Diffusion - Universität Amsterdam, Arbeitsgruppe Intelligent Sensory Information Systems
  • Bewegungsschätzung - Sekundärliteratur
  • Optischer Fluss - Matlab-Code von Björn Ommer
  • Beispiele zur Bildkompression mit FFT
  • Herleitung des Wiener-Filters
  •   Uni-Bonn - Math-Nat - Informatik   -   I   II   III   IV   V   VI

    Wobmaster - The Wob