Förfinat ramverk för beskrivning och tolkning av människor

En semantisk beskrivning av människan i bild och video är ett av de fundamentala problemen inom datorseende med en lång rad applikationer.

DatorseendeDatorseendeExempel på applikationer finns inom visuell övervakning, ansiktsigenkänning, hälsovård, sökmotorer för bild och video, taggning och inte minst för interaktionen mellan människa och maskin.

Människor har en enastående förmåga när det kommer till att upptäcka olika särdrag på en människa, som (1) ålder, kön, frisyr, klädstil (2) aktiviteter som ridning, klättring, löpning eller promenad liksom (3) ansiktsuttryck som ilska, skratt eller leende.

Vi utvecklar en helt ny lösning för djupinlärning för det utmanande problemet att semantiskt tolka en människa på bilder och videor.

Tonvikten läggs på att undersöka ett antal delproblem som exempelvis effektiv bild- och videobeskrivning, automatiskt inlärning från visuella modeller, lärande från text och visuella data liksom att få fram robusta metoder som fungerar med minimal övervakning.

Forskare
Visa/dölj innehåll

Publikationer
Visa/dölj innehåll

Ett urval av tre publikationer

Fahad Khan, Joost van de Weijer, Rao Muhammad Anwer, Andrew D. Bagdanov, Michael Felsberg, Jorma Laaksonen (2018)

Machine Vision and Applications , Vol.29 , s.55-71 Vidare till DOI

Fahad Khan, Jiaolong Xu, Joost van de Weijer, Andrew D. Bagdanov, Rao Muhammad Anwer, Antonio M. Lopez (2015)

IEEE Transactions on Image Processing , Vol.24 , s.4422-4432 Vidare till DOI

Rao Muhammad Anwer, Fahad Khan, Jorma Laaksonen (2018)

2018 INTERNATIONAL CONFERENCE ON BIOMETRICS (ICB) , s.90-97 Vidare till DOI

WASP forskning vid CVL
Visa/dölj innehåll