Zoals gezegd waren beeldherkenningsprogramma’s nog niet al te best, zeker niet als het er om ging om in videobeelden een bepaald iemand te kunnen volgen. Nu schijnen de onderzoekers dus een manier gevonden te hebben om honderden personen in een menigte te volgen.
Dat hebben ze, onder meer, voor elkaar gekregen door te voorspellen waar iemand heen gaat. De onderzoekers schreven een programma dat vijf factoren analyseert gebaseerd op de voorgaande beelden. Een daarvan is voorkomen: welke beeldstukjes komen overeen met die van het doelwit in het vorige beeld? Een andere is beweging: Waar zou het doelwit kunnen zijn, gegeven snelheid en richting? Een derde is de beweging van de nabije personen. Als het doelwit wat vaag wordt dan gaan het programma gokken aan de hand van de personen in diens buurt. De vierde factor is ruimtelijke nabijheid: mensen staan niet op dezelfde plaats. De vijfde is groepsvorming: als het programma een groep waarneemt, dan neemt dat aan dat die dezelfde vorm zal houden.
De individuen volgen wordt op die manier een beetje een probleem voor groepen met meer dan tien mensen, omdat je met een wiskundige benadering dan te veel wisselwerkingen krijgt. Daarom gebruiken de onderzoekers een iteratief (herhalend) algoritme dat een wat ruwer maar makkelijker te berekenen resultaat geeft waar iedereen zich beweegt. “Het is nog niet mogelijk een precieze oplossing te geven voor grote aantallen doelwitten”, zegt Afshin Dehghan die het werk samen deed met Mubarak Shah van de universiteit van Midden-Florida.
Praktijk
Om te kijken of je er in de praktijk wat mee kan, analyseerden de onderzoekers negen video’s van menigtes die in eerder onderzoek zijn gebruikt. De ‘menigte’ varieerde van 57 tot 747 mensen. De nauwkeurigheid waarmee alle personen konden worden gevolgd liep uiteen van 67 tot 99%. Dat resultaat was gelijk of (veel) beter dan vijf andere algoritmes, die mensen een voor een volgen. Het lijkt er op dat het meenemen van de gezamenlijke beweging het relatieve succes heeft bepaald. “Er werken groepsdynamische processen mee als je met ander mensen samen bent, vooral als die dicht bij elkaar staan”, zegt zegt informaticus Aniket Bera die massagedrag bestudeert. “Die informatie is in dit onderzoek gebruikt.
Hamid Rezatofighi van de universiteit van Adelaide in Australië, die ook werkt aan het volgen van meer personen tegelijk, vindt de techniek interessant, maar hij vraagt zich af hoe praktisch die is. Je moet zelf je doelwitten kiezen. Dus moet je aan het begin van een video elke persoon aanklikken die je wilt volgen. Vooralsnog werkt het systeem ook niet in de echte tijd. Het volgen van honderden mensen kan een seconde per beeldje duren, maar volgend Deghhan kan er nog heel wat verbeterd worden.
Deghhan: “Er zijn veel toepassingen om individuen in een massa te volgen.” Die hoeven helemaal niks met misdaad of terrorisme te maken te hebben. Zo’n algoritme zou ook gebruikt kunnen worden om de openbare ruimte zo goed mogelijk in te delen op basis, bijvoorbeeld, van doorstroming, maar de meest voor de hand liggende toepassingen zijn toch de bewakingsmogelijkheden waarbij veiligheid een rol speelt. Het onderzoek is deels betaald door Qatar. Het ging het emiraat daarbij vooral over de (on)veiligheid van grote menigtes. In Mekka liep het in 2015 gruwelijk uit de hand en werden 2000 pelgrims vertrapt. Ook het wk voetbal in 2022 in Qatar zal een rol hebben gespeeld geld in het onderzoek te steken.
Bron: Science