Nya metoder för att knyta samman probabilistiska modeller och djup maskininlärning

Probabilistiska modeller och djupinlärning är två framgångsrika tekniker som används inom maskininlärning. Dessa båda tekniker har komplementära egenskaper. För att kunna dra nytta av styrkorna hos båda teknikerna ämnar vi att utveckla nya metoder och teorier för att överbygga klyftan dem emellan.

AI(Artificial Intelligence) concept. Foto metamorworksProbabilistiska modeller används ofta inom statistik och maskininlärning. I en probabilistisk modell ses de olika variablerna som stokastiska (slumpmässiga) och de beroenden som finns mellan variablerna representeras av en sannolikhetsfördelning.

Probabilistiska modeller har många önskvärda egenskaper. Bland annat möjliggör de att systematiskt hantera den osäkerhet som i princip all data i praktiken är behäftat med. Modellerna bli därigenom ”medvetna” om osäkerheten i deras prediktioner, något som är av yttersta vikt för att kvalitetssäkra de system där metoderna används.

Djupinlärning är en gren av maskininlärning som de senaste åren haft enastående framgångar inom en rad olika tillämpningar, så som datorseende, språkteknologi och mycket mer. Djupinlärning baseras på modeller som kallas för artificiella neurala nätverk. I de flesta fall tränas dessa nätverk med hjälp av övervakad inlärning från stora mängder träningsdata.

Tyvärr har framstegen inom djupinlärning också ett pris, de neurala nätverken saknar ofta de önskvärda egenskaper som finns hos probabilistiska modeller, som kvantifiering av osäkerhet och möjligheten att utnyttja a priori-kunskap om struktur och beroenden hos data.

I det här projektet vill vi utveckla teorier och metoder relaterade till samspelet mellan probabilistiska modeller och djupinlärning.

Vi avser att utveckla både nya modeller och nya inlärningsalgoritmer för tillämpningar där vissa variabler naturligt beskrivs med hjälp av exempelvis probabilistiska grafiska modeller eller stokastiska processer, medan data hämtas från ett område där djupinlärning har visat sig vara framgångsrikt (till exempel bilder).

Inom projektet kommer vi undersöka tillämpningar av den nya teorin inom bland annat medicinskt beslutsstöd, för aktiv maskininlärning och för halvövervakad inlärning av dynamiska system. Det finns dock ett stort antal tillämpningsområden som kan dra nytta av samspelet mellan djupinlärning och probabilistiska modeller och vi förväntar oss därför att resultatet av projektet ska komma till bred användning.


Forskare
Visa/dölj innehåll

Forskning maskininlärning
Visa/dölj innehåll

WASP
Visa/dölj innehåll