Künstliche Intelligenz in der Videoanalyse

Bei der Videoanalyse wird künstliche Intelligenz eingesetzt, um verschiedene Aufgaben durch Anwendung von Computer Vision und Deep Learning auf Videomaterial oder Live-Videostreams zu erfüllen. Die Videoanalyse wird manchmal auch als Videoinhaltsanalyse oder intelligente Videoanalyse bezeichnet.

Neuartige Videoanalysetechnologien gewinnen schnell an Popularität. Zu den Hauptanwendern gehören sowohl Unternehmen, die die neuesten KI-Technologien nutzen wollen, um seit langem bestehende Probleme zu lösen, als auch solche, die Videoüberwachungssysteme bereits vor dem Aufkommen der künstlichen Intelligenz (KI) betrieben haben.

Die Fortschritte im Bereich des Deep Learning und des maschinellen Lernens, beides Teilbereiche der KI, haben es der Videoanalyse ermöglicht, die Landschaft der Aufgabenautomatisierung zu verändern, die früher menschliches Eingreifen erforderte, um erfolgreich automatisiert zu werden.

Die Trends auf dem Videoanalysemarkt entwickeln sich ständig weiter. Die jüngsten Fortschritte in der Videoanalyse nutzen Deep Learning für die Analyse von Videoinhalten, die Möglichkeit der Videoverarbeitung in Echtzeit und die erhöhte Genauigkeit von Videoerkennungssoftware.

KI-gestützte Videoanalyse
Bei der Vielzahl von Kamerabildern ist ein Mensch nicht mehr in der Lage alles im Blick zu behalten. Bei diesem Dilemma hilft die KI-gestützte Videoanalyse.

Videoanalyse-Prozesse

Wie erfolgt die Objekterkennung in der Videoanalyse?

Die Objekterkennung in Videofeeds in Echtzeit ist seit Jahren durch das Aufkommen von Algorithmen wie Mask R-CNN oder YOLO möglich. Diese Algorithmen sind vorgefertigt und bereit, den Unterschied zwischen Objekten in einem Sichtfeld zu erkennen.

Sie ermöglichen es zum Beispiel Videoanalyseprogrammen, Objekte wie Fahrzeuge, Personen, Ampeln usw. in Echtzeit zu erkennen und zu verfolgen. Diese Objekte werden gekennzeichnet und können für Aufgaben wie die Fahrzeug- oder Personenzählung in belebten Gebieten verwendet werden.

Bewegungserkennung

Die Videobewegungserkennung ist eine Methode zur Bestimmung von Aktivitäten in einer Szene durch Analyse der Unterschiede in einer Reihe von Bildern. Die Erkennung von Videobewegungen erfolgt in der Regel durch Verfahren wie Frame-Referenzierung oder Pixelabgleich.

Bei der Bildreferenzierung und dem Pixelabgleich werden horizontale oder vertikale Änderungen zwischen Videobildern erkannt und als Erkennungen gewertet. Diese Technik ist für die Analyse von Videos mit Bewegungserkennung üblich. Sie kann entweder in ein Netzwerk-Videoprodukt (z.B. IP/CCTV-Kameras) integriert oder mit einer Videoverwaltungssoftware verfügbar gemacht werden.

Der Videoanalyse-Markt

Zu den traditionellen Akteuren auf dem Videoanalysemarkt gehören Cisco, Avigilon, Axis Communications, Aventura Systems, Genetec, IBM, IntelliVision, Bosch Security, Huawei und andere. Der Videoanalysemarkt ist in Dienstleistungen und Software unterteilt. Die meisten Unternehmen haben sich auf die Entwicklung von Videoanalyseprodukten spezialisiert, die konsumiert werden können (Dienstleistungen), oder auf Software, die für den Erfolg der Produkte erforderlich ist.

Branchen, die die Videoanalyse nutzen

Die größten Anwendungen auf dem Videoanalysemarkt betreffen die Sicherheit: Erkennung von Zwischenfällen, Einbruchsmanagement, Personenzählung, Verkehrsüberwachung, automatische Nummernschilderkennung (ANPR), Gesichtserkennung, AR, Schätzung von Ego-Bewegungen. Darüber hinaus ist die Videoanalytik für Branchen wie Fertigung, Sicherheit, Einzelhandel, Gesundheitswesen und Gastgewerbe nützlich.

In jüngster Zeit wurden neue Computer-Vision-Plattformen eingeführt, die es Unternehmen ermöglichen, maßgeschneiderte Videoanalyseanwendungen zu entwickeln. Videoanalyselösungen, die mit Low-Code-Entwicklungsplattformen erstellt werden, helfen Unternehmen, individuelle Videoanalyselösungen einzuführen und bieten gleichzeitig die Funktionalität, Geschwindigkeit, Einfachheit und Flexibilität fertiger Softwarelösungen.

Sicherheit

Die Videoanalyse bietet Lösungen für die Sicherheit, indem sie ein allgemeines Mittel zur Identifizierung und Erkennung verschiedener Objekte in Videoströmen schafft. Diese Technologie ist nützlich für die Verfolgung von Personen oder Objekten von Interesse in Videos oder die Identifizierung und Erkennung von Eindringlingen. Durch den Einsatz der Videoanalyse für diese Zwecke können bestimmte Objekte markiert und bei verdächtigem Verhalten Alarme ausgelöst werden.

Gesichtserkennung bei der Videoanalyse mit künstlicher Intelligenz
Beliebtes Beispiel: Gesichtserkennung bei der Videoanalyse mithilfe der künstlichen Intelligenz

Vertikale Bewegungserkennung

Ein konkretes Beispiel für den Einsatz von Videoanalyse für Sicherheitszwecke wäre ein System zur Erkennung des Übersteigens von Zäunen. Das Sicherheitspersonal ist in der Regel so geschult, dass es weiß, dass Personen, die außerhalb eines Zauns spazieren gehen, als normal gelten, das Klettern auf den Zaun oder das Kämpfen mit dem Zaun jedoch als unregelmäßig.

Eine Kameraüberwachungssoftware, die darauf geschult ist, die feinen Unterschiede in der Bewegungsrichtung zwischen regulärem und irregulärem Verhalten am Zaun zu erkennen, kann mit den Echtzeit-Videobildern der Sicherheitskameras verknüpft werden.

Wenn jemand beginnt, den Zaun hochzuklettern, erkennt die Software die vertikale Bewegung als abnormales Ereignis und löst eine Art Alarm aus. Würde dagegen jemand neben dem Zaun laufen, so würde er eine horizontale Bewegung ausführen, die vom Erkennungssystem nicht als verdächtige Aktivität eingestuft wird.

Klassifizierung von Objekten in Videoübertragungen

Bei der Klassifizierung von Objekten in Videoübertragungen geht es darum, gefährliche Objekte in einer Live-Kameraübertragung oder einem bestimmten Video zu erkennen. Kleine Unterschiede zwischen Objekten, die manchmal sogar für das Sicherheitspersonal vor der Kamera schwer zu erkennen sind, können von Videoanalyseprogrammen erkannt werden, die darauf trainiert sind, winzige Unterschiede zu finden, die den Unterschied zwischen einem gefährlichen und einem sicheren Objekt ausmachen können.

Bei der Röntgen-Sicherheitskontrolle können beispielsweise Videoanalyseprogramme eingesetzt werden, die für die Objektklassifizierung von Gepäckstücken bei der Sicherheitskontrolle in Echtzeit geschult sind, um bestimmte Objekte von Interesse, wie scharfe Werkzeuge oder Waffen, zu erkennen. Diese Technologie wird bereits weltweit eingesetzt, da ihre Genauigkeit zunimmt. Die Transportsicherheitsbehörde (TSA) hat Computertomographen (CT) mit modernster 3D-Technologie an den Kontrollstellen der US-Flughäfen eingeführt.

Die Technologie wird derzeit weiterentwickelt, um die Genauigkeit bei der Erkennung von Objekten in Videobildern zu erhöhen, und wurde bereits erfolgreich mit Bildern getestet.

Verfolgung von Verhaltensweisen

Ähnlich wie bei der Bewegungserkennung, die im Beispiel des Zauns erörtert wurde, sind auch andere Verhaltensweisen für die Klassifizierung durch die Videoanalyse von Bedeutung. Bei der Verhaltensverfolgung geht es beispielsweise um das Verhalten von Menschen sowohl in Bezug auf sich selbst als auch auf größere Objekte, wie z.B. Fahrzeuge, und was dies für die Sicherheit eines allgemeinen Bereichs bedeutet. Im Folgenden sind drei kleinere Beispiele für die Verhaltensverfolgung in der Videoanalyse zu finden:

  • Erkennung von Herumlungern: In Smart Cities wird die Videoanalyse darauf trainiert, zu erkennen, wenn Personen oder Fahrzeuge länger als die vom Benutzer festgelegte Zeit in einem bestimmten Bereich verweilen. Je nach den Präferenzen des Programmanbieters kann ein Alarm ausgelöst werden, um die Sicherheit des Gebiets zu gewährleisten. Dieses Verhalten ist effektiv bei der Echtzeit-Benachrichtigung über verdächtiges Verhalten in der Nähe von Apotheken, Geldautomaten und anderen Orten.
  • Erkennung von angehaltenen Fahrzeugen: Dieser Teil der Videoanalyse ist nützlich, um zu verhindern, dass Fahrzeuge an einem nicht genehmigten Ort für längere Zeit im Leerlauf stehen oder stehen bleiben. Fahrzeuge, die länger als die vom Benutzer festgelegte Zeit in der Nähe eines sensiblen Bereichs stehen, werden erkannt. Dieses Verhalten ist ideal, um Fahrzeuge daran zu hindern, Lade- und Empfangsdocks zu blockieren, Parkregeln durchzusetzen und die Wartezeit von Fahrzeugen beim Parkservice oder an Parkschranken zu verkürzen. Angehaltene Fahrzeuge im fließenden Verkehr können auch auf nicht gemeldete Unfälle oder Fahrzeugprobleme hinweisen, und eine solche Technologie kann die zuständigen Behörden auf diese Fälle aufmerksam machen.
  • Kamera-Sabotage: Eine fortschrittliche Videoverlusterkennung kann erkennen, wenn ein Live-Videostream beeinträchtigt oder manipuliert wurde. Wenn z.B. ein Vandale ein Objektiv bemalt oder abdeckt oder eine fest installierte Kamera von einer bestimmten Szene wegbewegt, wird ein Alarm ausgelöst.

Einzelhandel

Der Einzelhandel kann die KI-gestützte Videoanalyse in verschiedenen Situationen einsetzen. Diese Komponenten des Einzelhandelsmanagements tragen zur Rationalisierung der Abläufe und zur Verbesserung des Kundenerlebnisses bei, ohne die Verantwortung der Mitarbeiter zu erhöhen oder weitere Betriebskosten für teure Geräte zu verursachen.

  • Verwaltung von Warteschlangen: Die Videoanalyse liefert Informationen über bessere Richtlinien für die Kassenabfertigung und kann sogar dafür sorgen, dass die Läden kassenfrei arbeiten können. So können Geschäfte Self-Checkout- und Honour-Code-Aktivitäten durchführen, ohne Ladendiebstahl oder andere schändliche Verstöße befürchten zu müssen. Das Warteschlangenmanagement kann auch Aufschluss darüber geben, was funktioniert und was nicht, um die Größe der Warteschlangen in den Geschäften zu steuern. Während einer Pandemie könnte das Warteschlangenmanagement beispielsweise entscheidend sein, um eine Ausbreitung zu verhindern.
  • Personenzählung: Die Personenzählung kann mithilfe der Videoanalyse durchgeführt werden. Im Einzelhandel wird viel mit Auslagen und Marketingstrategien experimentiert. Die Beobachtung oder der Zugriff darauf, wie viele Kunden wann kommen, ist für Geschäfte hilfreich, um zu wissen, was in Bezug auf Marketing und Produktübersicht funktioniert. Darüber hinaus ist es für das Geschäft nützlich zu wissen, wie viele Kunden sich längere Zeit in der Nähe der Auslagen aufhalten, da dies das Kundenerlebnis und das Geschäft des Geschäfts verbessert. In Bezug auf die Personenzählung liefert die Videoanalyse betriebliche Erkenntnisse und Erkenntnisse über die Markenbildung und offenbart eine Vielzahl anderer Aspekte der Kundenbeziehungen.

Gesundheitswesen

Einrichtungen des Gesundheitswesens legen seit jeher großen Wert auf moderne Technologien, um Kosten zu senken und die Sicherheit ihrer Praxis zu gewährleisten, da das Gesundheitswesen als Branche strengen staatlichen und unternehmensinternen Vorschriften unterworfen ist. Die Implementierung von Videoanalysen kann im Gesundheitswesen für die psychische Gesundheit, die Genauigkeit von Diagnosen und die Überwachung älterer oder junger Patienten in Krankenhäusern nützlich sein.

  • Überwachung im häuslichen Umfeld: Überwachungstechnologie macht die Überwachung älterer Patienten in Pflegeheimen möglich und für das Pflegepersonal bequem. Stürze sind eine der Hauptursachen für Verletzungen und Todesfälle bei älteren Menschen, weshalb die häusliche Überwachung nützlich ist, um ungewöhnliche Positionen oder Zeiträume zu erkennen, in denen eine Person auf dem Boden liegt oder bewegungsunfähig ist. Persönliche medizinische Geräte können Stürze effizient erkennen, müssen aber immer getragen werden, um wirksam zu sein. Die Videoanalyse für die KI-Sturzerkennung bietet eine freihändige Lösung und kann so modifiziert werden, dass sie mehr als nur Stürze erkennt. So könnte ein solches System beispielsweise auch feststellen, ob ein älterer Mensch ein bestimmtes Medikament rechtzeitig eingenommen hat.
  • Psychische Gesundheit: Die Kombination von fortschrittlicher Videoanalyse und maschinellem Lernen mit Gesichtsanalyse und dem Fachwissen menschlicher Ärzte kann die Fähigkeit eines Gesundheitsdienstleisters verbessern, die richtigen Schlüsse über den geistigen Gesundheitszustand eines Patienten zu ziehen. Ein bekannter Ansatz ist die Analyse von Gesichtsemotionen mit KI. Die Videoanalyse kann so trainiert werden, dass sie Unterschiede zwischen normalem und abnormalem Gesichts- oder Körperverhalten aufzeigt. Fachkräfte im Gesundheitswesen zeichnen diese nonverbalen Kommunikationen oft als Teil ihrer Prognose auf, allerdings auf recht subjektive Weise und nur, wenn sie sie bemerken. Die Videoanalyse in Anwendungen für die psychische Gesundheit stellt sicher, dass subtile Anzeichen im Verhalten eines Patienten nicht unbemerkt bleiben.
  • Biotechnologie: Das frühzeitige Screening von Krankheitserregern, die durch Lebensmittel übertragen werden, ist ein Schlüssel zur Gewährleistung der Lebensmittelsicherheit. Derzeit wird an Biosensoren geforscht, die Salmonellen durch Smartphone-Videoverarbeitung und Fluoreszenzmarkierung aufspüren sollen. Die Videoanalytik kann auch Live-Übertragungen von Bakterien analysieren und bestimmte Bakterien von anderen unterscheiden, was sich als nützlich erweist, um Unterschiede in der bakteriellen Zusammensetzung zu erkennen.

Smart Cities

Die Echtzeit-Videoanalyse mit Deep-Learning-Algorithmen wird vor allem in intelligenten Städten eingesetzt. Mehrere Unternehmen, die im Bereich der Videoanalyse tätig sind, versuchen, mehr integrierte Lösungen für Städte zu entwickeln. Im Februar 2019 hat Cisco zum Beispiel die Entwicklung eines Modells zur Erforschung von Smart-City-Lösungen in Norwegen in bekanntgegeben. Eine „Smart City“ nutzt digitale Technologien, um das Leben der Bürger zu verbinden, zu schützen und zu verbessern. IoT-Sensoren, Videokameras, soziale Medien und andere Eingaben fungieren als Nervensystem, das dem Stadtbetreiber und den Bürgern ein ständiges Feedback liefert, um fundierte Entscheidungen zu treffen.

Smart Cities Kamerasystem
Die Kameraüberwachung ist allgegenwärtig. In Smart Cities nimmt sie einen noch größeren Stellenwert ein.

Die städtischen Behörden können durch Echtzeitdaten und behördeninterne Zusammenarbeit mehr Bürgerbeteiligung erreichen und den Betrieb optimieren. Aus wirtschaftlicher Sicht fördern Smart-City-Funktionen neue Einnahmequellen und die wirtschaftliche Entwicklung, indem sie die Kundenaktivität und das Bewusstsein für das Kundenverhalten verbessern.

Die Videoanalyse ist für Städte und Gemeinden nützlich, die große Menschenmengen verwalten und Teil des Smart-City-Modells sind. Automatische Nummernschilderkennung und Verkehrsüberwachung sind zwei Beispiele für den Einsatz von Videoanalysen in Städten. Diese Anwendungen rationalisieren ansonsten mühsame Prozesse, die ausreichend menschliches Eingreifen erfordern.

  • ANPR: Die automatische Kennzeichenerkennung (Automatic Number Plate Recognition, ANPR) besteht aus präzisen Systemen, die in der Lage sind, Fahrzeugkennzeichen ohne menschliches Eingreifen zu lesen. Die Verwendung von Hochgeschwindigkeits-Bilderfassung mit unterstützender Beleuchtung ermöglicht es den Videoanalysesystemen, Nummernschilder nahezu in Echtzeit zu erkennen und zu lesen. Dazu werden die Zeichen der Nummernschilder mittels optischer Zeichenerkennung (OCR) erkannt und die Bilder in digitale Textzeichenfolgen umgewandelt. Auf diese Weise können Videoanalysesysteme Nummernschilder erkennen und aufzeichnen. Moderne ANPR-Programme erstellen Metadatensätze für jedes erkannte Nummernschild, die die Behörden in anderen Systemen weiterverwenden können. ANPR ist nützlich für die Erfassung von Fahrzeugen, die rote Ampeln überfahren, von Verkehrsunfällen und vielem mehr.
  • Verkehrsüberwachung: Die Videoanalyse kann Erkenntnisse liefern, die für die Analyse des Verkehrs und die Überwachung von Staus nützlich sind. Neben der Erkennung gefährlicher Unfälle und Situationen liefert die Verkehrsüberwachung quantitative Erkenntnisse über die Anzahl der Fahrzeuge in bestimmten Bereichen zu bestimmten Zeiten und über Verkehrsmuster. Im Falle eines Unfalls unterstützen diese Analysesysteme zur Verkehrsanalyse später die Polizei bei der Sammlung von Beweisen im Falle eines Rechtsstreits.
  • Fahrzeugzählung: Dieser Aspekt der Videoanalyse beinhaltet die Unterscheidung zwischen Autos, Lastwagen, Bussen und Taxis, um Hilfe zu leisten.

Was kommt als Nächstes?

Die Videoanalyse bleibt ein interessanter Aspekt und eine Anwendung der Computer Vision als Teil der visuellen künstlichen Intelligenz birgt eine Mange Potential. Die Entwicklung sowie die Forschung in diesem Bereich schreiten immer weiter voran und die Anwendungen werden immer genauer und ausgeklügelter. Es ist spannend zu beobachten, was alles passiert und wir werden gerne weiter darüber berichten.

Aber auch in diversen anderen Bereichen ist die Künstliche Intelligenz mittlerweile im Einsatz. Selbst bei den Steuereklärungen wird sie genutzt.

3 Kommentare

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert