Dr. Daniel Keysers

(DFKI)

"Modeling of Image Variability for Recognition"

Die automatische Klassifikation und Analyse digitaler Bilder besitzt vielfältige Anwendungen in Bereichen wie der Handschrifterkennung, der Suche in digitalen Bilddatenbanken und der medizinischen Bildverarbeitung. In den meisten Anwendungsbereichen unterliegen die Bilder und die darin abgebildeten Objekte einer starken Variabilität, die beim Erkennungsprozess berücksichtigt werden muss, um hohe Erkennungsraten zu erzielen.
Im Vortrag werden verschiedene Ansätze zur Modellierung der Bildvariabilität für die erscheinungsbasierte Bilderkennung vorgestellt. Es werden einerseits lineare und andererseits nichtlineare, diskrete Verformungsmodelle verschiedener Ordnung diskutiert. Für die diskreten Modelle, die Pixel auf Pixel abbilden, kann festgestellt werden, dass es besonders wichtig ist, den Kontext jedes Pixels geeignet zu berücksichtigen. Die vorgestellten Modelle werden für die Erkennung handgeschriebener Zeichen, die Objekterkennung und die Kategorisierung medizinischer Bilder verwendet und erreichen dabei sehr gute Ergebnisse. Insbesondere wird eine Fehlerrate von 0,5% auf der bekannten MNIST Benchmark für handgeschriebene Ziffern erzielt. Schließlich kann gezeigt werden, dass die Variabilitätsmodellierung auch die Ergebnisse für die erscheinungsbasierte Gebärdenspracherkennung und die Gestenerkennung verbessert, was verdeutlicht, dass sie eine Vielzahl von Anwendungsmöglichkeiten besitzt.



Zeit: Montag, 25.06.2007, 17.15 Uhr
Ort: Gebäude 48, Raum 210