Artificiell intelligens
Maskininlärning är en gren av artificiell intelligens och går ut på att datorer självständigt ska förstå och hantera stora mängder data och lära sig att se mönster utifrån dessa. De senaste framstegen har lett till högpresterande innovationer inom många områden, bland annat i specialistsjukvården där datorer till exempel har lärt sig att ställa hudcancerdiagnoser.
- Det handlar om att lära datorer att se mönster som är av värde för oss människor, säger Dylan Mäenpää, tidigare student vid Institutionen för datavetenskap, vid Linköpings universitet.
I juni 2021 presenterade han sitt examensarbete som handlade om hur maskininlärning kan utvecklas ytterligare genom att bli både snabbare och mindre sårbar. Han arbete belönas nu med Christer Giléns stipendium 2021 på 10 000 kronor.
- Det är alltid roligt att få ett stipendium och få ett erkännande för sitt arbete, säger han.
Behov av forskning
Intresset för området maskininlärning väcktes när Dylan Mäenpää upptäckte att det fanns relativt lite forskning kring det som inom maskininlärning kallas federated learning. Det är en maskininlärningsmetod som används i verksamheter där det är känsligt och svårt att dela data, till exempel mellan sjukhus.
- Maskininlärning kräver ofta en stor mängd data för att de tränade modellerna ska bli bra. Data kan i många scenarion vara svår att få tag i på grund av GDPR eller att man inte får dela data hur som helst. Då kan det på många platser vara svårt att träna upp en bra modell.
Federated learning innebär att enheter, som i sjukvårdsexemplet kan utgöras av sjukhus, tränar sina modeller på var sitt håll med sin lokala data. När tekniken utvecklats kan sjukhusen sedan dela modellerna med varandra i stället för att dela data. Vanligtvis med federated learning delas modellerna genom att samla dem på en central plats där sjukhusen interagerar. Dylan Mäenpää ville i sitt examensarbete jämföra den metoden med en variant där sjukhusen skulle kunna interagera med varandra direkt i stället, med en så kallad peer-to-peer-modell.
Han simulerade olika scenarier på en dator där 100 olika ”platser” fick lära sig att klassificera nummer som de sedan fick dela med sig av till en central enhet. Därefter jämförde han resultatet där de olika platserna delade med sig av sin klassificeringsmodell direkt med varandra (peer-to-peer-modellen).
Flera fördelar
Det finns flera fördelar med peer-to-peer-systemet, enligt Dylan Mäenpää.
- Rent teoretiskt räknade jag fram att det kunde gå snabbare, givet de resultaten vi kunde se på simulationerna. När man endast delar modellerna med en central plats så måste flera enheter kommunicera med den centrala enheten vilket kan göra att inlärningsprocessen saktas ned. Pratar enheterna med varandra så eliminerar man en eventuell flaskhals som kommer med en central plats. Det innebär att själva upplärningen av modellen kan gå snabbare.
En annan fördel är att systemet inte blir lika sårbart. En central enhet riskerar att förstöra upplärningsprocessen om det skulle bli något tekniskt fel.
- Det finns ingen single point of failure som man brukar säga.
Numera bor Dylan Mäenpää i Borås och arbetar som it-konsult på ett företag i Göteborg som är inriktad på e-handel.
Titeln på Dylan Mäenpääs examensarbete är “Towards Peer-to-Peer Federated Learning: Algorithms and Comparisons to Centralized Federated Learning” och presenterades den 1 juni 2021.
Mer om priset
Motiveringen till priset är bland annat att Dylan Mäenpääs arbete ”visar både på djup förståelse för existerande metoder och på en kreativitet att skapa nya metoder som sedan utvärderats gediget. Att utveckla metoder för distribuerad maskininlärning där ingen nod i systemet har tillgång till all känsliga data har stor potential för att kunna kombinera inlärning med personlig integritet.”
Christer Gilén-stipendierna delas ut varje år sedan 2019 och prissumman varierar mellan 5 000 och 20 000 kronor. Grundaren till priset är alumnen Christer Gilén som donerat hundra tusen kronor till Jubileumsstiftelsen. Målet är att uppmuntra studentarbeten som kan leda till tillämpningar inom det privata näringslivet eller i den offentliga sektorn.
Stipendierna delas ut inom områdena ”statistik och maskininlärning” samt ”ekonomisk styrning, organisation och innovation”.