Paradatec KI-Modul Image Denoising

29 April 2022

Paradatec KI-Modul Image Denoising

Erklärbarkeit und Nachvollziehbarkeit sind zentrale Aspekte der ethisch verantwortungsvollen Entwicklung und Anwendung von Künstlicher Intelligenz (KI): Wir müssen wissen, warum ein KI-System zu gewissen Resultaten gelangt.

Die KI-Forschung bei Paradatec übernimmt diese Verantwortung. Schon während des Forschungs- und Entwicklungsprozesses neuer KI-Module analysieren wir diese systematisch. Demonstrieren möchten wir dies anhand eines KI-Moduls, welches bei Paradatec beforscht und entwickelt wird: dem sog. “Image Denoising”. Image Denoising dient dem “Entrauschen” von Bildern, die digitalen Eingangskanälen entspringen, seien es Smartphone Apps, E-Mail-Anhänge oder Web Page-Formulare. Solcherart “user born” Inhalte können von minderer Bildqualität sein. Das Image Denoising korrigiert diese, indem es bspw. Belichtungsverhältnisse korrigiert, Kompressionsartefakte entfernt und beschädigte Buchstaben “repariert”.

Eine Eingabe in dieses KI-Modul könnte bspw. folgendermaßen aussehen (Abbildung 1 – Eingabe in das KI-Modul „Image Denoising“):

Der gewählte Bildauschnitt ist verrauscht: die Rückseite des Dokuments ist auch auf der Vorderseite zu erkennen — sie “scheint durch”. Die Ausgabe des KI-Moduls “Image Denoising” sieht dann bspw. folgendermaßen aus (Abbildung 2 – Ausgabe des KI-Moduls „Image Denoising“):

Das Rauschen wurde entfernt, ebenso die durchscheinende Rückseite.

Wenn wir nun visualisieren, was auf dem „Weg“ von der Eingabe zur Ausgabe im KI-Modul “Image Denoising” passiert, sehen wir, dass das Modell gelernt hat, horizontale und vertikale Linien zu erkennen, die kein Rauschen sind, sondern in der Ausgabe beibehalten werden sollen, bspw. weil ich es sich um die Buchstaben der Vorderseite des Dokuments handelt.

Abbildung 3 verdeutlicht dies (Das KI-Modul “Image Denoising” hat erlernt, horizontale bzw. nach rechts abfallende Linien (Abbildung links) sowie vertikale bzw. stark nach rechts ansteigende Linien (Abbildung rechts) zu erkennen.):

Umso heller ein Bildpunkt in der Visualisierung, umso sicherer ist sich das KI-Modul, dass es sich hier um den Teil einer Linie handelt, die beibehalten werden soll.

Bestätigen lässt sich diese Hypothese dadurch, dass wir — durch einen „Activation Maximization“ genannten Optimierungsprozess — Eingabe-Bilder generieren, für die sich das KI-Modul sicher ist, dass es sich hierbei um entsprechende Linien handelt. Abbildung 4 zeigt zwei dieser automatisch generierten Eingabe-Bilder (Eingabe-Bilder, bei denen sich die das KI-Modul “Image Denoising” sicher ist, dass es sich um horizontale bzw. nach rechts abfallende Linien (Abbildung links) sowie vertikale bzw. stark nach rechts ansteigende Linien (Abbildung rechts) handelt, die beibehalten werden sollen.):

Diese Visualisierungen erlauben es, die Entscheidungen des KI-Moduls nachzuvollziehen und schaffen dadurch Vertrauen. Ebenso ermöglichen sie es auch, die Leistungsfähigkeit eines KI-Moduls einzuschätzen, um es genau dort einzusetzen, wo es nützlich ist.

Dieser Artikel wurde von Dr. Robert Remus, Senior AI Architect bei Paradatec GmbH, geschrieben.