Computer Vision

Computer Vision macht den Seh-Sinn auch für Maschinen zugänglich.

Automatisierte Bildanalyse

Methodik

Das Sehen gilt nicht umsonst als unser wichtigster Sinn: Etwa ein Viertel des menschlichen Gehirns ist mit der Wahrnehmung und Interpretation von Licht beschäftigt. Computer Vision macht diesen Sinn auch für Maschinen zugänglich. Anders als beim Menschen kommen die Bilddaten aus den unterschiedlichsten Quellen, wie z. B. Dokumentenscannern, Smartphones, Filmkameras, Hochleistungs-Industriekameras oder bildgebenden Verfahren aus der Medizintechnik. Mikrowellen und Infrarotstrahlung sowie UV- und Röntgenstrahlen machen sichtbar, was im sichtbaren Spektrum verborgen bleibt. Tiefenbilder oder Punktwolken können analysiert werden, um Distanzen oder Volumen besser abzubilden. Dazu kommt eine große Bandbreite an räumlicher Auflösung, die von wenigen Mikrometern pro Pixel in der Mikroskopie bis zu mehreren Metern pro Pixel in Satellitenbildern reicht. Dieser unglaublichen Vielfalt steht eine nicht minder beeindruckende Vielfalt an verarbeitenden Methoden von klassischer Bildverarbeitung bis hin zu Deep Learning gegenüber. Wir helfen Ihnen, den Überblick zu behalten!

Einsatzszenarien

Ob für industrielle Fertigung, Landwirtschaft, Medizintechnik, Einzelhandel, Fernerkundung, Automotive oder in der Medienbranche: überall dort, wo visuelle Analysen oder Entscheidungen notwendig sind, kann Computer Vision eingesetzt werden. Häufig werden manuelle Beobachtungen unterstützt oder routinemäßige Prozesse automatisiert, um diese zu beschleunigen und objektive sowie reproduzierbare Bewertungen zu ermöglichen.

Computer Vision Modelle zielen jedoch nicht nur darauf ab, den Ist-Zustand zu analysieren, sondern können auch eingesetzt werden, um Ereignisse in der Zukunft vorherzusagen: “Wird die Person über die Straße gehen?“, “Wann ist die Maschine defekt?“ oder „Wie hoch wird die Ernte ausfallen?“ sind beispielhafte Fragestellungen. Um Veränderungen schnellstmöglich zu erkennen und rechtzeitig reagieren zu können, wird hierbei auf Videos statt Einzelbilder gesetzt.

Die Informationen, die aus Bildern extrahiert werden, können vielfältig genutzt werden: Fachpersonal reagiert auf gefundene Defekte, faules Obst wird aussortiert, Roboter umfahren erkannte Hindernisse und Ärzte untersuchen auffälliges Gewebe. Erkannte Objekte oder Bildeigenschaften können ebenfalls als Metadaten für recommender Systems weiterverarbeitet werden, Sprachmodelle können mittels erkannter Objekte Bildbeschreibungen generieren und andersherum können mittels prompts auch neue Bilder generiert werden.

Wie wir arbeiten

Agil & Transparent

Von der Auswahl oder Erstellung eines Bilddatensatzes, über das Training von Computer Vision Modellen bis zur Integration in den laufenden Betrieb – wir betrachten die gesamte Prozesskette mit Ihnen gemeinsam. 

Vom ersten Proof of Concept bis zum fertigen Produkt mit integrierten MLOps Pipelines arbeiten wir agil und transparent mit Ihnen gemeinsam an der optimalen Lösung. 

Unsere Experten im Bereich der klassischen Bildverarbeitung sowie im Deep Learning wählen die geeigneten Modelle und Architekturen aus und trainieren diese zielgerichtet. Wir analysieren die Performanz, untersuchen mögliche Fehlerquellen und optimieren den Lösungsansatz bis auch im laufenden Betrieb alle Anforderungen erfüllt sind. Auch Beschränkungen in der zur Verfügung stehenden Hardware stellen kein Hindernis dar, wie beispielsweise unser Use Case TinyML zeigt, bei dem ein Modell optimiert wird, um mit der Speicherkapazität und Rechenleistung eines Mikrocontrollers auszukommen. 

Sie sind sich noch gar nicht sicher, ob Ihr Problem mit Computer Vision gelöst werden kann und welche Anforderungen dafür erfüllt sein müssen? Dann sind Sie bei unseren Product Discovery Workshops richtig.

Lösungen aus der Praxis

spotsize: Besseres Schuhkauf-Erlebnis durch Größenfindung mit AI

spotsize hat eine Augmented-Reality-Lösung entwickelt, die in Online-Shops das Schuhkauf-Erlebnis verfügbar macht, das Kund:innen aus stationären Geschäften kennen. Mithilfe von Machine Learning vermisst das Programm per Smartphone-Kamera die Füße der Kund:innen und bestimmt auf dieser Basis entsprechende Schuhgrößen. Spotsize suchte einen Partner für die Umsetzung der ML-Komponenten der App und hat diesen mit inovex gefunden.

CASE STUDY LESEN

So kann Computer Vision auch bei Ihnen eingesetzt werden

Einzelhandel / Online-Verkauf

Ein großer Teil des Handels findet online statt, und das Kundenerlebnis wird durch Computer Vision verbessert: Produktfotos werden klassifiziert, automatisch nach Kategorien sortiert und Kunden werden basierend auf Bildern ähnliche Produkte vorgeschlagen. Darüber hinaus können Produktbilder komplett KI-gestützt generiert oder abgewandelt werden, so dass z.B. aus einem Produktfoto von einem Sofa realistische Varianten (andere Farben, Größen, Wohnzimmerhintergrund) generiert werden. In unser Case Study mit SpotSize zeigen wir wie Computer Vision eingesetzt werden kann, um das online Kauferlebnis zu verbessern: Indem der Kunde zu Hause seine Füße einscannt und diese per App automatisch vermisst, wird die optimale Schuhgröße ermittelt und aufwendige Retouren werden vermieden. Doch auch im Offline-Geschäft können Computer Vision Modelle nützlich sein, etwa um den Verkaufsraum optimal auf Kundenströme auszurichten oder für personalisierte Kaufempfehlungen mit Smart Mirrors.

Industrie und verarbeitendes Gewerbe

In der Industrie kann Computer Vision eingesetzt werden, um die Qualität von Produkten zu prüfen, Produkte zu sortieren oder Materialfehler zu erkennen – sowohl in- als auch offline. 

Auch Produktionsmaschinen können mittels Computer Vision laufend überwacht werden, um zu erkennen, ob eine frühzeitige Wartung notwendig ist (predictive maintenance). Schlecht zugängliche Bereiche wie Stromleitungen, Windräder oder Kräne, aber auch große Industrieanlagen können mit Drohnen abgeflogen und die aufgenommenen Bilder analysiert werden, um mögliche Defekte zu erkennen oder eine Fernwartung durchzuführen. Roboter in einer Produktionsstraße können neben repetitiven Tätigkeiten auch komplexere Aufgaben bearbeiten, wenn sie mit Computer Vision ausgestattet sind.

Eine typische Herausforderung in industriellen Anwendungen ist das Fehlen von Trainingsdaten, die für die verwendeten hochauflösenden Kameras oder speziellen Bildgebungsverfahren geeignet sind. Generative AI hilft hier, z.B. durch Erhöhung der Auflösung mit Super Resolution, durch Anreicherung von Datensätzen mit generierten Bildern oder durch Überführung in eine neue Domäne, z.B. synthetische Infrarotbilder aus RGB-Bildern.

Sie finden sich in keiner der Branchen wieder? Sprechen Sie uns gerne an, egal ob Sie eine erste Idee haben oder schon einen konkreten Lösungsweg vor Augen – unsere Experten unterstützen Sie und gehen mit Ihnen den nächsten Schritt.

Dr. Florian Wilhelm
Florian Wilhelm
Head of Data Science, Ansprechperson Data Management & Analytics
inovex Logo

Hallo! 👋
Wie können wir Sie unterstützen?

Wie können wir Sie unterstützen?

Florian Wilhelm

Head of Data Science, Ansprechperson Data Management & Analytics

inovex Podcast

Klicken Sie auf den unteren Button, um den Inhalt von Podigee zu laden und Cookies zuzulassen.

Inhalt laden

Mehr informationen finden Sie in der Datenschutzerklärung.

Ihr Browser (Brave) verhindert aktuell die Einblendung dieses Widgets. Bitte passen Sie Ihre Einstellungen an oder verwenden Sie einen anderen Browser.
PHNjcmlwdCBjbGFzcz0icG9kaWdlZS1wb2RjYXN0LXBsYXllciIgc3JjPSJodHRwczovL3BsYXllci5wb2RpZ2VlLWNkbi5uZXQvcG9kY2FzdC1wbGF5ZXIvamF2YXNjcmlwdHMvcG9kaWdlZS1wb2RjYXN0LXBsYXllci5qcyIgZGF0YS1jb25maWd1cmF0aW9uPSJodHRwczovL2RpZ2l0YWwtZnV0dXJlLnBvZGlnZWUuaW8vMzItY29tcHV0ZXItdmlzaW9uL2VtYmVkP2NvbnRleHQ9ZXh0ZXJuYWwiPjwvc2NyaXB0Pg==