Readspeaker menu


 


Organisatorisches

Vorlesung im Hauptstudium Informatik (SS 2005)

Dozent: Prof. Dr. Joachim Denzler

Zeit und Ort: Mo, 12-14 (SR 121), Mi, 12-14 (SR 121)

Übungen: 2SWS

Voraussetzungen: Grundlagen Digitale Bildverarbeitung erwünscht

Sonstiges: Geeignet auch für Mathematiker, Physiker und Lehramt Mathematik/Informatik


Überblick

In dieser Vorlesung werden die Grundlagen des 3-D Rechnersehens vermittelt. Der erste Teil der Vorlesung beschäftigt sich mit Kameramodellen, dem Prozess der Bildaufnahme sowie typischen Problemen (z.B. dem Rauschen), die man bei der Verarbeitung realer Bilder zu lösen hat. Außerdem erfolgt ein Einstieg in die Projektive Geometrie. Im zweiten Teil der Vorlesung werden Verfahren zur Extraktion von einfachen und komplexen Merkmalen aus Bildern oder Bildfolgen vorgestellt, die für eine spätere 3-D Rekonstruktion von Objekten oder Szenen, aber auch für die Objekterkennung eine wichtige Rolle spielen. Im dritten Teil der Vorlesung behandeln wir verschiedene Verfahren, wie die Parameter einer Kamera automatisch bestimmt werden können (Kamerakalibrierung), und wie mittels Methoden der Stereobildverarbeitung 3- D Information berechnet werden kann. Den dritten Teil runden Verfahren ab, mittels derer man aus einer langen Folge von Bildern automatisch die Parameter der Kamera und Tiefeninformation bestimmen kann. Im letzten Teil der Vorlesung geht es dann um Verfahren der Bewegungsberechnung in Bildfolgen sowie um aktuelle Verfahren zur 3-D Objekterkennung. Konkrete Anwendungen dem Bereich Medizin, Computer Grafik und Robotik runden die Vorlesung auf der Anwendungsebene ab.

 

Die Vorlesung hat das Ziel, die notwendigen theoretischen Kenntnisse im Bereich des 3-D Rechnersehens zu vermitteln und konkrete Algorithmen und effiziente Implementationen vorzustellen. Ein Besuch der Rechnerübung und Bearbeitung der gestellten Programmieraufgaben ist deshalb unerlässlich. Die Vorlesung baut im Prinzip auf der Vorlesung Einführung in die digitale Bildverarbeitung des Wintersemester auf, kann jedoch wegen der Wiederholung der notwendigen Verfahren aus dieser Vorlesung auch alleine gehört werden. Lücken im Grundwissen (Singulärwertzerlegung, statistische Tests, lineare Algebra, Hauptachsentransformation, etc.) werden im Verlauf der Vorlesung durch kurze Exkurse ergänzt.

 

Grundlage der Vorlesung ist das Lehrbuch von Trucco und Veri, das für die Bibliothek in größerer Anzahl beschafft wurde und als Textbuch dringend empfohlen wird. Ergänzend im Bereich der 3-D Rekonstruktion können die beiden Lehrbücher von Hartley/Zisserman oder Faugeras herangezogen werden. Die Folien der Vorlesung werden ergänzend als Skript zur Verfügung gestellt.


Vorlesungsmaterialien


Literatur

Trucco, Verri: Introductory Techniques for 3-D Computer Vision. Prentice Hall. 1998
Hartley, Zisserman: Multiple View Geometry in Computer Vision. Cambridge University Press. 2004
Faugeras, Luong: The Geometry of Multiple Images. MIT Press, 2001.