Am Donnerstag, den 25. April 2024, öffnete die BurdaSolutions am Standort Offenburg seine Türen für einen ganz besonderen Anlass: den alljährlichen Girls‘ Day.
E-Commerce, Portalentwicklungen, komplexe Datenarchitekturen, individuelle Software- und Technologie-Lösungen für Smart Data: Das sind die Themen der Experten von Valiton, einem Unternehmen von BurdaSolutions. Heute erklärt Manuel Borst, Senior Data Scientist bei Valiton, anhand von konkreten Beispielen, wie automatisierte Bilderkennung dank Künstlicher Intelligenz (KI) funktioniert.
Künstliche Intelligenz ist für manch einen nur ein Buzzword und überzogener Hype. Insbesondere die Fähigkeit der Maschinen, zu lernen, setzt jedoch unbestritten täglich neue Maßstäbe. Neben zahlreichen Unterdisziplinen wie etwa dem Erkennen komplexer Zusammenhänge in strukturierten Daten für Vorhersagen oder der Verarbeitung menschlicher Sprache, hat unter anderem die automatisierte Bilderkennung in letzter Zeit bemerkenswerte Fortschritte gemacht.
Wie funktioniert Image Recognition und was meint man, wenn man von „Klassifizierung“, „Objekterkennung“ und „Instance Segmentation“ spricht?
Typischerweise werden aktuell drei Grundaufgaben mit der Image Recognition (Bilderkennung) gelöst. Bei der einfachen „Klassifizierung“ wird ein Bild automatisch einer oder mehreren Kategorien zugeordnet, also etwa einer speziellen Tierart oder einer Konsumgütergruppe. Ermöglicht wird das, indem man einem künstlichen neuronalen Netz sehr viele Bilder unterschiedlicher Kategorien zeigt, wobei es die einschlägigen Muster einer Kategorie lernt. Der Algorithmus identifiziert dann diese Muster in einem neuen Bild und gibt die am besten passende Kategorie zurück. Im folgenden Beispielbild gibt ein Klassifizierungsalgorithmus etwa die Kategorie „Vogel“ aus, ohne es je vorher gesehen zu haben.
Die „Objekterkennung“ findet alle Objekte in einem Bild und klassifiziert jedes einzeln, um ein Bild etwa automatisch mit Hashtags versehen zu können. Im Beispielbild wären das die Tags „Vogel“, „Tier“ und „Blume“:
Die sogenannte „Instance Segmentation“ geht einen Schritt weiter und lokalisiert die gefundenen Objekte im Bild pixelgenau – um sie zum Beispiel im Anschluss ausschneiden zu können (die Pixel des Vogels in türkis und die der Blume in pink - siehe Bild in Galerie).
Kannst Du einen typischen Anwendungsfall für Bilderkennung im Arbeitsalltag nennen?
Ein klassischer Use Case für Bilderkennung ist die automatische Moderation von User Generated Content. Hier bemühen sich Betreiber von Onlinediensten, ihre Seiten von unerwünschtem Inhalt ihrer Nutzer sauber zu halten. Dabei kann über Klassifizierung und Objekterkennung ein Bild entweder schon beim Upload (Stichwort Uploadfilter) oder spätestens vor der Veröffentlichung automatisch als „not safe for work“ klassifiziert und automatisch abgefangen werden.
Wie fein ist die Erkennung der einzelnen Bildelemente – Könnte man nach spezifischen Vogelarten suchen?
Mit dieser Technologie könnte z.B. ein Vogelklassifikator gebaut werden, der zunächst erkennt, ob im hochgeladenen Bild überhaupt ein Vogel abgebildet ist (Objekterkennung). Anschließend könnte er mit Instance Segmentation ausgeschnitten werden. Ohne die störenden weiteren Informationen auf dem Bild tut sich ein darauffolgender Klassifizierungsalgorithmus für den nun isolierten Vogel leichter, ihn etwa in eine der ca. 40 häufigsten heimischen Gartenvogelarten zu kategorisieren.
Welche Use Cases wären mit dieser Technologie noch möglich?
Es gibt unzählige weitere Anwendungsgebiete, wie z.B. das Erkennen bestimmter Personen oder Landschaften auf Bildern oder die Analyse von Gesichtszügen vor und nach dem Verlassen eines Geschäfts. Auch die bahnbrechenden Fortschritte bei der automatischen Tumorerkennung auf Röntgenbildern sind mit automatisierter Bilderkennung möglich geworden.
Die Valiton GmbH ist eine Tochter von BurdaSolutions. Als interner IT-Dienstleister mit Standort Offenburg und München erstellt Valiton innovative Lösungen aus den Bereichen Softwareentwicklung, Data-Science und Data Engineering für Burda-Units.