Durch künstliche Intelligenz gesteuerte Erkennung von Drängelverhalten in Menschenmengen

In dieser Forschungsarbeit wurde ein neuartiges automatisches KI-basiertes Systementwickelt, um Drängln in Menschenmengen zu erkennen, insbesondere in Videoaufnahmen und Live-Kamerastreams von überfüllten Einlässen zu Veranstaltungen.

Ziel der Arbeit ist es, Veranstaltern und Sicherheitsdiensten das nötige Wissen zur Verfügung zu stellen, um Drängeln in Menschenmengen und die damit verbundenen Risiken zu verringern, den Komfort der Menschen zu erhöhen und potenziell lebensbedrohliche Situationen zu verhindern. Die Entwicklung des Framework bestand aus drei Phasen:

Ein Beispiel von Drängeln

Erste Phase: Identifizierung von Regionen mit Gedränge in Videoaufnahmen

In der ersten Projektphase wurde ein neuer Ansatz entwickelt, der auf einem vortrainierten Deep-Learning-Modell für den optischen Fluss, einem angepassten und trainierten EfficientNetV1B0-basierten Convolutional Neural Network (CNN) und einem Algorithmus zur Fehlerreduktion basiert. Dieser Ansatz zielt darauf ab, Regionen zu identifizieren, die Personen enthalten, die in Videos von Menschenmengen drängeln. Jede Region umfasst ungefähr eine Fläche von 1 bis 2 Quadratmetern. Durch die Identifizierung dieser Regionen kann ein besseres Verständnis gewonnen werden, wann, wo und warum ein Drängeln in Menschenmengen auftritt. Dieses Wissen ist für die Entwicklung effektiver Crowd-Mangement - Strategien für Veranstaltungen und zur Verbesserung der Gestaltung öffentlicher Räume von Bedeutung.

Das Modell wurde anhand mehrerer Experimente trainiert, die eine geradlinige Warteschlange mit einer Einlasskontrolle darstellt. Die experimentellen Ergebnisse zeigen, dass der Ansatz eine Genauigkeit von 88 % und eine F1-Punktzahl erreicht.

Beispiel eines annotierten Videos (erste Phase). Grüne Kästen kennzeichnen Regionen in denen Gedränge zu beobachten ist.
Artificial Intelligence-Driven Detection of Pushing Behavior in Human Crowds
Konfusionsmatrix des vorgeschlagenen Ansatzes in der ersten Phase.

Zweite Phase: Echtzeit-Erkennung von Gedränge in Live-Kamerastreams

In der zweiten Projektphase haben wir einen neuen Cloud-basierten Deep-Learning-Ansatz vorgeschlagen, um Drängler in dichten Menschenmengen in Echtzeit zu erkennen. Die Erkennung in Echtzeit ermöglicht Veranstaltern und Sicherheitskräften frühzeitig einzugreifen. Darüber hinaus kann eine solche frühzeitige Identifizierung bei der Bewertung der Maßnahmen des Crowd-Managements helfen und eine frühzeitige Erkennung von Schwachstellen und Maßnahmen zur Optimierung ermöglichen.

Der technische Ansatz zur Analyse des Videostreams zur Erkennung von Regionen in Echtzeit kombiniert ein robustes, schnelles und vorab trainiertes KI-Modell für den ‚Optischen Fluss‘ , ein angepasstes und trainiertes EficientNetV2B0-basiertes CNN-Modell und eine Farbradmethode. Für die Bereitstellung leistungsfähiger Ressourcen wird eine Live-Aufnahmetechnologie und eine Cloud-Umgebung verwendet.

Für das Training und die Evaluierung des Cloud-basierten Ansatzes wurden Daten aus Experimenten verwendet, in denen unterschiedliche Aufbauten von Warteschlangesystemen und Einlassschleusen untersucht wurden. In Testläufen konnten wir zeigen, dass es mit diesem Ansatz möglich ist Bereiche mit Gedränge aus dem Live-Kamera-Stream mit einer Genauigkeit von 87 % und innerhalb einer angemessenen Zeitverzögerung von 4 Sekunden zu erkennen.

Beispiel für einen Schnappschuss aus einem annotierten Videostream. Die grünen Kästchen kennzeichnen die vom Cloud-basierten Ansatz ermittelten Regionen. Konfusionsmatrix des Cloud-basierten Ansatzes.
Artificial Intelligence-Driven Detection of Pushing Behavior in Human Crowds
Konfusionsmatrix des Cloud-basierten Ansatzes.

Dritte Phase: Erkennung einzelner Personen, die in einer Menschenmengen drängeln

Während sich die ersten beiden Phasen auf die bereichsbezogene Erkennung konzentrieren, wurde in der dritten Phase ein innovativer Ansatz zur Identifizierung von drängelnden Personen in Menschenmengenvideos eingeführt, der auf Voronoi Diagrammen basiert. Die Analyse der Dynamik des Drängelverhaltens auf mikroskopischer Ebene kann genauere Einblicke in das Verhalten und die Interaktionen von Menschenmengen liefern. Dieses tiefe Verständnis hilft bei der Entwicklung effektiverer Crowd-Management-Strategien und zuverlässigerer, genauerer Simulationsmodelle.

Der vorgestellte Ansatz verwendet Fußgänger-Trajektorendaten als zusätzliche Eingabequelle. Ähnlich wie in der zweiten Phase, aber mit mehr realen Experimenten, wurde dieser Ansatz trainiert und bewertet. Die experimentellen Ergebnisse zeigen, dass der Ansatz eine Genauigkeit von 85 % erreicht.

Ein illustriertes Beispiel eines kommentierten Videostroms, der mit dem Voronoi-basierten CNN-Ansatz erzeugt wurde. Grüne Kästen zeigen schiebende Personen an.
Artificial Intelligence-Driven Detection of Pushing Behavior in Human Crowds
Konfusionsmatrix des Voronoi-basierten CNN-Ansatzes.

Artikel

Letzte Änderung: 04.07.2024