Edge AI Module Type1WV - AI Accelerator Module (mit der Coral Edge TPU™ von Google)
Im weitesten Sinne bezieht sich der Begriff "maschinelles Sehen" auf die Nutzung visueller und optischer Informationen mit Hilfe digitaler Technologien. Da sie jedoch in den Produktionsstätten der verarbeitenden Industrie eingeführt wird, bezieht sich die maschinelle Bildverarbeitung im Allgemeinen auf digitale Bildtechnologien, die bei der automatischen Inspektion und Prozessautomatisierung in Fabriken eingesetzt werden.
Die maschinelle Bildverarbeitung umfasst folgende Bereiche:
Abschnitt "Bildgebung" (Kameras)
Schnittstellenteil (Platine/Allzweckschnittstelle)
・Prozessorbereich (Computer)
・Verarbeitungssteuerung (Software)
usw.
Die vom Bildverarbeitungsbereich erhaltenen Bilddaten werden über den Schnittstellenbereich in die Verarbeitungsmaschine geladen. Im Bereich der Verarbeitungsmaschine führt der Verarbeitungssteuerungsbereich Binarisierung*1, Kantenerkennung*2 und andere Formen der Bildverarbeitung durch. Anschließend werden die Bilddaten, die die Bildverarbeitung abgeschlossen haben, an Roboter und Industrieanlagen ausgegeben.
*1: Verarbeitung, bei der die für das Bild vorgegebenen Pixelwerte (Schwellenwerte) in die beiden Werte Schwarz und Weiß umgewandelt werden.
*2: Verarbeitung zur Erkennung der hellen und dunklen Bereiche in einem Bild.
Die maschinelle Bildverarbeitung wird unter anderem bei der automatischen Prüfung, der automatischen Erkennung und der automatischen Messung eingesetzt. So sind beispielsweise die automatische Prüfung und die automatische Erkennung im Vergleich zur manuellen Prüfung sehr schnell. Darüber hinaus kann die maschinelle Bildverarbeitung bei automatischen Messungen kleine Wertunterschiede genau erkennen, die Menschen nicht messen können. Darüber hinaus wird erwartet, dass die Verknüpfung der maschinellen Bildverarbeitung mit KI-Funktionen in Zukunft weitere intelligente Anwendungen hervorbringen wird.
Computervision und Robotersicht sind Technologien, die dem maschinellen Sehen ähnlich sind, aber sie spielen jeweils unterschiedliche Rollen. Hier erklären wir, wie sich ihre Aufgaben unterscheiden.
"Computer Vision" ist eine Technologie, die die Funktionen der maschinellen Bildverarbeitung um Funktionen zur Gerätesteuerung ergänzt. Computer Vision kann verschiedene Arten von Geräten auf der Grundlage der von der maschinellen Bildverarbeitung ausgegebenen Daten steuern. So wäre es beispielsweise möglich, die von der maschinellen Bildverarbeitung ausgegebenen Bilddaten mit vom Computer generierten CAD-Daten zu kombinieren, um Prozessoren zu steuern, oder die Transportgeschwindigkeit von Förderbändern auf der Grundlage von Bilddaten anzupassen, die den Fortschritt der Fließbandarbeit erfasst haben.
Darüber hinaus hat das maschinelle Sehen ein breites Anwendungsspektrum, das natürlich auch intelligente Fabriken sowie Schiedsrichter-Assistenzsysteme und virtuelle Wiederholungen im Sport und Projection Mapping usw. in der Unterhaltung umfasst.
"Robot Vision" ist eine Technologie, die das maschinelle Sehen mit den visuellen Funktionen von Robotern verbindet. Bei der maschinellen Bildverarbeitung werden Kameras an verschiedenen Geräten angebracht, um Bilddaten zu erhalten, bei der Roboterbildverarbeitung hingegen werden Kameras an den Enden der Roboterarme angebracht, um Bilddaten zu erhalten. Dadurch kann der Roboter auf der Grundlage der von ihm selbst gewonnenen visuellen Informationen arbeiten.
Ein Roboter, der nicht mit Robot Vision ausgestattet ist, kann beispielsweise nur bestimmte, im Voraus programmierte Vorgänge ausführen. Wenn jedoch ein mit Robot Vision ausgestatteter Roboter seinen Roboterarm näher an ein Objekt heranführt, identifiziert er das Ziel nacheinander anhand der Bilddaten der Kamera und führt die entsprechenden Aktionen aus.
Da diese Art der Betriebssteuerung möglich ist, ist ein mit Robot Vision ausgestatteter Roboter in der Lage, detaillierte, präzise und flexible Vorgänge auszuführen, die nicht durch ein Programm festgelegt werden können.
In einer intelligenten Fabrik wird das maschinelle Sehen bei verschiedenen Arbeiten eingesetzt. Hier stellen wir ein Beispiel für den Einsatz der industriellen Bildverarbeitung vor.
OCR ist eine Technologie, die handschriftliche oder gedruckte Zeichen mit einem Bildscanner oder einer Digitalkamera einscannt. Die maschinelle Bildverarbeitung scannt den 2D-Code, die Seriennummer, das Herstellungsdatum usw., die auf Produkten aufgedruckt sind. Die gescannten Daten werden zur Überprüfung der Druckqualität oder der Richtigkeit der gedruckten Zeichen sowie zur Überprüfung des nächsten Prozesses usw. verwendet. In vielen Fällen durchlaufen die Produkte, die mit OCR gescannt werden, die Fertigungsstraße mit hoher Geschwindigkeit. Daher werden bei der maschinellen Bildverarbeitung Kameras eingesetzt, die Bilder mit hoher Geschwindigkeit erfassen können, sowie Bildverarbeitungssysteme, die eine hohe Verarbeitungsgeschwindigkeit ermöglichen.
Der Einsatz der maschinellen Bildverarbeitung gilt als das effektivste Mittel der Sichtprüfung in einer Fertigungslinie. Da die maschinelle Bildverarbeitung in der Lage ist, die Genauigkeit der Produkte nach dem Schneiden und Formen sowie den Montagezustand der Komponenten usw. mit hoher Geschwindigkeit und Genauigkeit zu prüfen, ist sie für die Verbesserung der Produktionseffizienz und die Aufrechterhaltung der Qualität von entscheidender Bedeutung. Die Oberflächen der Zielobjekte können in Bezug auf ihren Glanz, ihre Lichtabsorption usw. sehr unterschiedlich sein. Die in der maschinellen Bildverarbeitung verwendete Beleuchtung ermöglicht die Prüfung von Produkten mit unterschiedlichen Oberflächenbeschaffenheiten, indem die Beleuchtungsmethode und die Farbe der Lichtstrahlen geändert werden. Darüber hinaus können 3D-Kameras mit Stereofonie*3, Laufzeitmessung*4 und anderen Messsystemen sowie mit strukturiertem Licht*5 und anderen Bildgebungssystemen auch die Tiefe messen.
*3: Methode, bei der zwei Kameras verwendet werden, um eine Triangulation durchzuführen und die Entfernung zu einem Objekt zu messen.
*4: Verfahren, das die Entfernung zu einem Objekt anhand der Zeit misst, die das von einer Lichtquelle ausgestrahlte Licht benötigt, um von dem Objekt reflektiert zu werden und zu einem Lichtdetektor zurückzukehren.
*5: Beleuchtungsmethode, die Licht mit einem bestimmten Schattierungsmuster ausstrahlt.
Unter "Kommissionierung" in einer Fertigungslinie versteht man die Aufgabe, die benötigten Komponenten und Produkte zu sammeln (Pickup). Der Einsatz von Bildverarbeitungssystemen ermöglicht es, Komponenten mit der angegebenen Farbe und Form zu identifizieren und zu entnehmen, auch wenn Komponenten und Produkte mit verschiedenen Farben und Formen in einem Fall gemischt sind.
In den letzten Jahren wurden Industrieroboter aufgrund ihrer hohen Arbeitsgenauigkeit auch für Präzisionsarbeiten eingesetzt. So spielen sie beispielsweise beim Montieren, Löten und Schweißen von Mikrobauteilen eine aktive Rolle. Die Steuerung solcher Arbeiten durch Programmierung erfordert jedoch hochpräzise Positioniervorrichtungen. Bei der Roboterbildverarbeitung mit maschinellem Sehen sind keine hochpräzisen Positioniervorrichtungen erforderlich, da der Roboter mit den Bilddaten der am Ende des Roboterarms montierten Kamera eine präzise Positionierung vornehmen kann.
Da verschiedene Arten von Industrieausrüstungen auf den Einsatz von KI umsteigen, ist eine Form der Weiterentwicklung der maschinellen Bildverarbeitung, die vielversprechend ist, die "KI-Vision".
KI-Vision ist ein System, das leichtgewichtige KI-Chips in Smartphones usw. mit Kameras und Kamerafunktionen ausstattet, um Rückschlüsse auf erfasste Bilddaten zu ziehen. Die KI-Vision ähnelt der Computer-Vision insofern, als sie KI (künstliche Intelligenz) einsetzt, aber die Computer-Vision zieht ihre Schlüsse hauptsächlich mit einem Cloud-KI-Dienst (Abbildung 8).
Bei AI Vision hingegen wird ein KI-Modul in einem Edge-Gerät eingesetzt, um Rückschlüsse zu ziehen, und die Rückschlussergebnisse werden auf dem Edge-Server gespeichert. Der Edge-Server kommuniziert nur bei Bedarf mit der Cloud-KI. (Abbildung 9).
Daher hat die KI-Vision folgende Vorteile gegenüber der Computer-Vision:
Der Umfang der Kommunikation mit dem KI-Cloud-Dienst kann verringert werden.
Möglichkeit, externe Lecks der von den Sensoren gesammelten Daten zu verhindern
・Bessere Reaktionsfähigkeit
Darüber hinaus werden die Kameras und Smartphones, die für die KI-Vision verwendet werden, als "Edge-KI-Geräte" bezeichnet, während die Methode, die auf dem Edge-Gerät Schlussfolgerungen zieht, als "Edge-KI" bezeichnet wird.
Obwohl die KI-Vision die oben beschriebenen Vorteile hat, benötigen KI-Module, die in Edge-Geräte eingebaut werden, die folgenden Arten von Funktionen.
Bessere Energieeinsparung aufgrund von Beschränkungen der Batteriekapazität
Fähigkeit zur Hochgeschwindigkeitsverarbeitung aufgrund der Anforderung an die Reaktionsfähigkeit
Bessere Wärmeableitung aufgrund des begrenzten Platzes
Vor allem ist es wichtig, dass die AI-Module kompakt sind.
Dieser Artikel erläutert das Thema maschinelles Sehen und die ähnlichen Begriffe Computer Vision und Robot Vision sowie AI Vision. Es wird erwartet, dass sich maschinelles Sehen und KI in Zukunft in engem Zusammenhang mit der Entwicklung des Deep Learning für Bilddaten entwickeln werden. Darüber hinaus ist zu erwarten, dass neue KI-Systeme und -Produkte durch den richtigen Einsatz von Cloud-KI und Edge-KI entwickelt werden.
Diese Trends werden wahrscheinlich zu wesentlichen Technologien für intelligente Fabrikroboter, automatische Inspektion, automatische Erkennung und automatische Messgeräte werden, die visuelle Informationen benötigen, die dem menschlichen Auge ähnlicher sind, und Entscheidungsfähigkeiten, die die des Menschen übertreffen.