LiU-forskare vann tävling i datorseende

09 september 2014

Monica Westman Svenselius

Forskare på LiU:s avdelning för datorseende tog hem segern i en internationell tävling med sin metod att följa rörliga objekt – en bil eller ett ansikte i en folksamling. Applikationerna för metoden är många, bara fantasin sätter gränserna.

Tävlingen Visual Object Tracking Challenge, VOT, avgörs årligen och vinnaren avslöjades i samband med den stora konferensen European Conference on Computer Vision som just nu pågår i Zurich.

Forskargrupper från hela världen deltar och i år gick segern till professor Michael Felsberg och hans team vid Linköpings universitet. Bakom den segrande metoden står Martin Danelljan, doktorand på Avdelningen för datorseende, hans handledare Fahad Khan och Michael Felsberg samt Gustav Häger, blivande civilingenjör i Datateknik som gör sitt examensarbete inom just visuell objektföljning.

– En stor del av underlaget till vår vinnande metod har tagits fram av studenter i grundutbildningen. Delar av Martin Danelljans examensarbete publicerades på en av de största konferenserna inom ämnet, Conference of Computer Vision and Pattern Recognition, CVPR. Gustav Häger gör sitt examensarbete nu. Vi har lagt ner ett stort arbete under många år på att höja nivån på grundutbildningen så att den ligger i absoluta fronten. Det har gett resultat och det är fantastiskt roligt både för oss och studenterna, säger Michael Felsberg.

Datorseende i mobilen

Datorseendet är på väg ut i praktisk användning på bred front. I bilar för att upptäcka skyltar, trottoarkanter eller uppdykande fotgängare. I obemannade flygande farkoster för att hitta nödställda på en stormig alptopp eller ett upprört hav, liksom för säkerhet och bevakning. En enkel variant av datorseende finns också i våra mobiltelefoners kameror. Finns det ett ansikte i din bild ställer kameran själv in fokus på det. Möjligheten att utveckla appar till mobilen som bygger på foton och bilder är i det närmaste oändliga.

Ett problem som världens forskare nu lägger ner möda på att lösa är metoder för att följa rörliga objekt. Att fokusera på och följa ett ansikte i en rörig omgivning, som i en folksamling eller på en friidrottsarena fungerar för de flesta av oss människor. Vi tänker inte ens på vad vi gör. Men för en maskin är det betydligt svårare. Beräkningarna måste dessutom vara snabba för att objektet ska kunna följas i realtid
Martin Danelljan

Foto: Monica Westman
– Det här är klassiska problem inom datorseende, men vi har tagit fram en både noggrann och robust metod, berättar Martin Danelljan.

En knut LiU-forskarna löst är det faktum att om objektet rör sig från eller mot kameran så minskar respektive ökar storleken på den yta på bilden eller i videon som datorn ska följa.

– Vi har fokuserat på att lösa skalproblemet eftersom vi snabbt tappar effektivitet om inte den del i videon som datorn följer skalas upp eller ner. Risken är annars att man studerar bakgrunden istället för själva objektet.

Avancerad datorinlärning

Metoden är uppdelad i två delar, en del som bestämmer var i bilden det objekt finns som ska följas och den andra hur stort objektet är för närvarande.

Därefter handlar det om avancerad datorinlärning. Datorn får lära sig hur det in-zoomade objektet ser ut i olika lägen, eller snarast hur några väl valda särdrag i bilden ser ut. Det kan vara en kant eller en intensitet i en färg som används för identifikationen. Beräkningarna sker sedan snabbt med väl valda och effektiva algoritmer.

– Vi har valt metoder med inspiration från biologiska system och gör beräkningarna på helheten istället för att dela upp problemet i många små delar. Vi har valt en holistisk ansats till objektföljning och arbetar även så inom robotiken. Att vi lyckats så väl med vår metod är ett bevis för att vi valt rätt väg, säger Michael Felsberg.

I tävlingen testas de inskickade metoderna på ett stort antal olika videosekvenser. Det handlar om allt ifrån att följa vindsurfare och friidrottare till människor som går över en gata. I år testades närmare 40 olika metoder.

– Det är verkligen roligt att vi vann, de ökar vår synlighet otroligt mycket. Vi har varit kända i branschen sedan tidigare, men nu har vi blivit kändisar, säger Michael Felsberg, som redan fått flera inbjudningar - som att medverka i en expertpanel och i VOT-kommittén.

I ett bidrag till konferensen Computer Vision and Patterning Regognition, CVPR, i USA presenterar LiU-forskarna också en variant av metoden där även färginformationen i bilderna används för att förbättra resultatet.

Videor som visar metoden
cvl.isy.liu.se/research/objrec/visualtracking/index.html
Avdelningen för Datorseende, ISY (eng)
Visual Object Tracking Challenge, VOT2014, extern länk
http://www.votchallenge.net/vot2014/index.html
2014-09-09

Forskare

Michael Felsberg

Professor, Avdelningschef

Fahad Khan

Universitetslektor, Docent

Datorseende i mobilen

Avancerad datorinlärning

Forskare

Taggar

Dela på