AI hjälper roboten att fatta bra och snabba beslut

För att robotar ska kunna röra sig bland människor i den vanliga världen behöver de kunna fatta beslut i realtid, utan mänsklig hjälp. WASP-doktoranden Olov Andersson har i sin avhandling undersökt tre olika metoder för lärande.

 Olov Andersson visar hur drönaren viker undan och anpassar sig efter den promenerande människan.  Thor Balkhed

Verkligheten är osäker och föränderlig, vi människor rör oss oberäkneligt, väder och vind förändras och bilar, cyklar och djur kan dyka upp när vi minst anar det. Förvirrande för oss och än mer förvirrande för en robot som styrs av matematiska beräkningar.

– Världen stannar inte upp och väntar på att roboten ska fatta beslut, det måste ske här och nu. Robotar som rör sig i trafik eller på andra offentliga platser måste kunna ta beslut i realtid. Rent matematisk är osäkerheten från omgivningen ofta försummad i de beslutsprocesser som styr dagens autonoma system, säger Olov Andersson, nybliven tekn dr inom WASP, Wallenberg AI Autonomous Systems and Software Program.

Mått på osäkerheten

Det var gapet kring osäkerheten han ville fylla när han började arbeta med sin doktorsavhandling vid avdelningen Artificiell intelligens och integrerade system, Institutionen för datavetenskap. Anledningen till att osäkerheten inte funnits med i beräkningarna är att det blir både komplicerat och beräkningstungt och därför kräver mycket datorkraft. En flygande robot, en drönare, kan inte bära på hur många processorer som helst och batterierna får inte heller vara för tunga.

Olov Andersson har undersökt tre olika metoder, hämtade från artificiell intelligens, maskininlärning och reglerteknik.

Den första metoden, som hittills också visat sig vara den bästa - eller i alla fall mest framkomliga, är att låta roboten lära sig att risk-justera traditionell optimeringsbaserad styrning. Metoden bygger på probabilistiska metoder och ger därför ett tydligt mått på osäkerheten och roboten eller drönaren lär sig navigera säkert och fatta kloka beslut medan den flyger.

Demonstration på Gränsö

Olov Andersson demonstrerade detta inom ramen för WARA PS, WASP:s arena för publik säkerhet, på Gränsö i höstas. Drönaren lärde sig snabbt att träd och lyktstolpar stod Olov Andersson Foto Thor Balkhedstilla och flög nära dem, medan den behövde hålla ständig koll på människan, det vill säga Olov Andersson själv, och därför också hålla ett större avstånd. På en skärm kunde han också visa att osäkerheten, sannolikheten för att roboten skulle krascha in i något, låg på några få procent efter en liten stunds träning.

Den andra metoden han undersökt är att använda neuronnät, den typ av artificiell intelligens som också kallas djupinlärning.
Metoden går ut på att man lär upp ett neuralt nätverk vilka beslut som ska fattas, när och i vilket läge. Olov Andersson visar att metoden kan ha beräkningsmässiga fördelar, men den kräver enorma mängder träningsdata och det är svårare att tillfredsställa kraven på säkerhet.
– Det krävs en simulator i dag för att få tillräckliga mängder träningsdata, men förhoppningen är att neuronnäten kan bli mer effektiva i framtiden, säger han.

I den tredje metoden fokuserade han på att låta roboten lära sig mer komplexa interna modeller av verkligheten i realtid samtidigt som den måste agera. I en av avhandlingens artiklar visar han hur den här varianten kan användas för att söka efter överlevande efter en katastrof. Här kan man även utnyttja annan information som finns, egna observationer, geografiska data med mera.

Tvärvetenskap och tester

– Autonoma system är ett område som kräver både tvärvetenskap och möjlighet att göra praktiska tester. I avhandlingen finns artiklar publicerade inom artificiell intelligens, robotik och reglerteknik. Att jag fick vara en del av WASP och WASP:s forskarskola har varit en styrka här, det har funnits både djup och bred expertis inom alla dessa områden att diskutera med, säger han.

Olov Andersson ska nu fortsätta sin forskarbana hos Roland Siegwart, välkänd professor i autonoma system, vid ETH i Zürich.
– Jag har fått en Wallenberg postdoc via WASP och jag ser verkligen fram emot att få fördjupa mig ytterligare så att min forskning kan komma till nytta i framtiden.

Förutom finansiering via WASP har delar av forskningen också bedrivits inom den strategiska satsningen inom IT och informationsteknik, ELLIIT samt med finansiering från Stiftelsen för strategisk forskning SSF.

Learning to make safe real-time decisions under uncertainty for autonomous robots, Olov Andersson, Institutionen för datavetenskap, Linköpings universitet 2020
Handledare: professor Patrick Doherty.
Olov Andersson försvarade sin avhandling den 29 april 2020.

Inspelning från Gränsö, hösten 2019:

 


Kontakt
Visa/dölj innehåll

Relaterade nyheter
Visa/dölj innehåll

Relaterad forskning
Visa/dölj innehåll

Senaste nytt från LiU
Visa/dölj innehåll