Readspeaker menu

Seminar Semantische Segmentierung (Fortgeschrittene Methoden im Rechnersehen)

Dipl.-Inf. Erik Rodner

Inhalte

Ein wichtiges Forschungsgebiet im Bereich des Rechnersehens ist die semantische Interpretation von Bildern. Unter diesem Begriff versteht man die Beschriftung oder Klassifikation von Objektinstanzen vorher erlernter Objektkategorien. Generell lassen sich drei Stufen dieser Aufgabenstellung nach Art der Beschriftung unterscheiden: Bildkategorisierung - das gesamte Bild erhält eine Beschriftung; Objektlokalisierung - Bestimmung des umschreibenden Rechteckes der Objektinstanzen; Semantische Segmentierung - Beschriftung jedes Pixels mit der zugehörigen Klasse.

Die semantische Segmentierung ist dabei als schwierigste Aufgabenstellung anzusehen. Die Klassifikation jedes Pixels erfordert effiziente Techniken des maschinellen Lernens welche mit vielen Trainingsdaten und unter Verwendung von
Merkmalsräumen großer Dimension angelernt werden können. Weiterhin ist es oft notwendig, lokale Entscheidungen aufgrund von Kontextinformationen oder unüberwachter Segmentierungen zu einem Gesamtergebnis zu kombinieren und zu verfeinern.

Das Seminar soll ein Überblick über verschiedene aktuelle Ansätze geben und deren Grundidee vermitteln. Von jedem Seminarteilnehmer wird ein 30-minütiger Vortrag erwartet, eine 7-10 Seiten lange Ausarbeitung, Anwesenheit sowie aktive Mitarbeit.

Links

Moduldaten

Wahlpflichtmodul (Seminar DBV) für den M.Sc. Informatik
SemSeg1.jpg

SemSeg2.jpg

SemSeg3.jpg
Eingabebild, manuelle Annotierung für die Lern- und Testphase und Ergebnis eines Beispielverfahrens.
(Quelle: J. Shotton)