Institut für Informatik
Rheinische Friedrich-Wilhelms-Universität Bonn
Vorlesung (Hauptstudium)Digitale Bildverarbeitung und Computersehen IProf. Dr. J. Buhmann
Bildverarbeitung und Computersehen ist ein Teilgebiet der Informatik, das sich mit der Extraktion von Objektinformation aus Bildern beschaeftigt. Klassische Methoden zur Kantenextraktion, zur Bewegungsschaetzung, zur Stereoextraktion, zur Beleuchtungsschaetzung und zur Texturklassifikation werden vorgestellt. Active vision und Bildsequenzenverarbeitung sollen ausfuehrlich diskutiert werden. Der Schwerpunkt der Vorlesung liegt bei early (low level) vision und mathematischen Methoden wie Markov random fields und Auflösungspyramiden.
ÜbungsblätterDiese Vorlesung bietet die Möglichkeit, durch eine erfolgreiche Bearbeitung der Übungsaufgaben einen Übungsschein zu erwerben. Auf Wunsch kann dieser Schein auch benotet ausgestellt werden.FolienDie in der Vorlesung verwendeten Folien werden schrittweise im PDF-Format auf dieser Seite verfügbar sein.Die Vorlesung in StichwortenI EINFÜHRUNGI.1 Motivation I.2 Bildentstehungsprozess I.3 Perspektivische Projektion, Lochkameramodell, homogene Koordinaten, Verzerrungen, Kalibrierung I.4 Linsen, Tiefennschärfe I.5 Bildaufnahme, Phototransistor, Fehlerquellen I.6 Rauscheinflüsse, Pixelrauschen, Poissonverteilung, Rauschmodelle ohne räumliche Korrelation I.7 Radiometrie: Beleuchungsdichte/Leuchtdichte, Bildentstehung II VERARBEITUNG RÄUMLICH STETIGER BILDER II.1 Fourierreihen, punktweise Konvergenz, Konvergenzvoraussetzungen, Satz von du Bois, stückw. Stetigkeit, Besselsche Ungleichung, Eindeutigkeit von Fourierkoeffizienten, orthogonale Funktionensysteme, verallgemeinerte Fourierreihen, Gibbs-Phänomen, komplexe Fourierkoeffizienten II.2 Kontinuierliche Fouriertransformation und Umkehrtransformation, Transformation einer Gaußglocke, Eigenschaften der Fouriertransformation (Linearität, Verschiebung, Skalierung, Modulation, Ableitung), Faltung im Orts- und Frequenzraum, Autokorrelation, Parsevalsche Gleichung, Schnelle Fouriertransformation (FFT) für 1- und 2-dim. Signale, Anwendung: Filterung und Kompression II.3 Bilder als kontinuierl. 2-dim. Funktionen, Bildverzerrung, lineare verschiebungsinvariante Systeme, Dirac-Funktion II.4 Faltung und Impulsantwort ( Point-Spread -Funktion), Beispiel: Defokussierung, atmosphärische Störungen, Kommutativität und Assoziativität der Faltungsoperation II.5 Modulationstransferfunktion, FT für rotationssymmetr. Kerne, naiver Tiefpass, verbesserter Tiefpasss, Bilddegradation: Bewegungsverschmierung, Bildrestauration II.6 Optimales lineares Filtern, SNR, Wienerfilter, Bildmodelle: Leistungsspektrum natürl. Bilder, räumlich unkorreliertes Rauschen, Signal-Rausch-Spektren, Wienerfilterung für Bildentrauschung und nachverarbeitete Bilder II.7 Mathematischer Exkurs: Variationsrechnung, Fundamentallemma der Variationsrechnung, Herleitung der Eulergleichung, Erweiterungen: Einbeziehung höherer Ableitungen, Nebenbedingungen, mehrdim. Variationsrechnung II.8 Nichtlineare Filterung, Median-Filter, SNR und Peak-SNR, Diffusionsfilter, Eigenschaften: Maxima-Erhaltung, keine Artefakte; Skalenraum-Prinzip; nichtlineare Diffusion: Perona-Malik-Modell III VERARBEITUNG DISKRETER BILDER III.1 Abtast-Theorem mit Beweis, Abtasten von Bildern (2D), Aliasing-Fehler, Tiefpassfilterung oder überlappende Sensoren als Gegenmaßnahme III.2 Grauwertquantisierung, Lloyd-Max-Quantisierer, Parameterintegrale (Exkurs), Vektorquantisierung: K-Means-Algorithmus, LBG-Algorithmus, Quantisierungsartefakte (Contouring), Kontrastquantisierung, Halbtonbilder ("Dithering"): Floyd-Steinberg-Dithering III.3: Farbquantisierung: Farbwahrnehmung, physikalischer vs. perzeptiver Farbraum, CIE-Raum, LAB-Farbraum, Farbquantisierung mit Dithering IV KANTENEXTRAKTION IV.1 Marr's Philosophie der Bildrepräsentation: Early Vision, Primal Sketch, 2 1/2 DSketch, 3 D Sketch, Problemformalisierung, Repräsentation und Algorithmik, Hardware-Umsetzung IV.2 Primal Sketch: Zero Crossings -> Raw Primal Sketch -> Full Primal Sketch IV.3 Kirsch-Templates, Sobel-Operatoren, Umgang mit Rauschen, Marr-Hildreth-Detektor IV.4 Canny-Detektor: Axiomatisierung, Herleitung nach Tagare und de Figueiredo. Eigenschaften des Canny-Detektors: Lokalisierung, Maximadichte. Alternative Herleitung des DoG-Filters über ein Lokalisierungskriterium. Rice-Formel. Canny-Detektor in 2D, Vergleich mit Marr-Hildreth. IV.5 Auflösungspyramiden. Parzellierung des Orts- und Frequenzraums. Idee von Wavelets und Wavepackets. Unschärferelation. Gauß-Laplace-Pyramide, Pyramiden-Algorithmus. Rekonstruktion. Koeffizientenzahl im Vergleich zu Wavelets. IV.6 Wavelet-Transformation. Unterschied zur gefensterten Foriertransformation. Dilatationsgleichung und Skalierungsfunktion. Orthonormalität. Haar-Wavelets. Daubechie-Wavelets. Gabor-Wavelets. Multiskalenanalyse, Axiomatik IV.7 Skalenräume. Lineare Theorie, Halbgruppeneigenschaft, Skaleninvarianz und Pi-Theorem, Isotropie. Bsp: Zero-Tree-Technik. V BEWEGUNGSEXTRAKTION V.1 Optischer Fluss und Bewegungsfeld. Korrespondenzproblem. Aperturproblem. V.2 Zwangsbedingung für den optischen Fluss. Glattheitsannahme. Kostenfunktional und Herleitung der Euler-Gleichung mit Randbedingung. Modifikationen bei diffus streuenden Objekten in parallelem/divergentem Licht, selbst leuchtenden Objekten, Glanzlichern. Bewegungsfelder bei speziellen Bewegungen. V.3 Schätzung des optischen Flusses im diskreten Fall. Diskretisierung der DGL -> Multi-Grid-Verfahren. Alternative: Diskretisierung des Kostenfunktionals -> Horn/Schunk. Geometrische Interpretation. V.4 Alternative Methoden: Differentielle Techniken (Nagel), Differentialgeometrische Modellierung (Jähne), kleinste Fehlerquadrate (Barron), flächenbasierte Zuordnungsverfahren (Kreuzkorrelationsverfahren), energiebasierte Verfahren (Heger), phasenbasierte Verfahren (Fleet/Jepson) VI STEREOSEHEN VI.1 Geometrie, Epipole, Korrespondenzproblem, Rekonstruktionsproblem VI.2 Epipolarbedingung, Kamerakalibrierung, Disparität, Messfehler, zyklopisches Auge VI.3 Grauwertzuordnung, Kostenfunktion aus Glattheit und Zuordnungsfehler, Euler-Lagrange-Gleichungen, biharmonischer Operator, Diskretisierung, grauwertbasierte und merkmalsbasierte Ansätze, Random-Dot-Stereogramme VI.4 Marr-Poggio-Algorithmus: Zwangsbedingungen (Eindeutigkeit, Glattheit), eindim. Retina, Netzdynamik, Disparitätsberechnung, fehlende Ljapunow-Funktion VI.5 "Verbotene Zone": Verletzung der Ordnung auf der Epipolarlinie; Stereosehen mittels dynamischer Programmierung VI.6 Intensitäts- und merkmalsbasiertes Stereo-Matching: Intensitätszwangsbedingung, Kostenfunktion nach Wei/Hirzinger, parametrische Disparitätskarte (RBF-Funktionen), Lernregel VI.7 Phasenbasierter Stereo-Algorithmus nach Fleet/Jepson: Gaborkoeffizienten, Phasendifferenz, Regularisierung (Taylorentwicklung) Weiterführende Informationen |
|
Uni-Bonn
-
Math-Nat
-
Informatik
-
I
II
III
IV
V
VI |