Artificiella neurala nätverk kan användas för att hitta mönster i stora mängder data, som genetisk information. Foto metamorworks
I sociala medier är det vanligt att den tekniska plattformen ger dig vänförslag. Förslaget grundas på att du och den andra personen har gemensamma kontakter, och kanske därför också känner varandra. På liknande sätt kartlägger forskare biologiska nätverk som baseras på hur olika proteiner eller gener interagerar med varandra. Forskarna bakom en ny studie har nu tagit artificiell intelligens, AI, till hjälp och undersökt om det går att hitta biologiska nätverk genom att använda djupinlärning, det vill säga träna upp så kallade djupa artificiella neurala nätverk. Eftersom artificiella neurala nätverk är mycket bra på att lära sig att hitta mönster i enorma mängder komplexa data används de bland annat inom bildigenkänning. Men än så länge är det ovanligt att denna maskininlärningsmetod används inom biologisk forskning.
– I studien har vi för första gången använt djupinlärning för att hitta sjukdomsrelaterade gener. Det är en mycket kraftfull metod för att analysera stora mängder biologisk information, så kallad big data, säger Sanjiv Dwivedi, postdoktor vid Institutionen för fysik, kemi och biologi (IFM) vid Linköpings universitet.
Forskarna använde en stor databas med information om hur 20 000 olika gener uttrycks hos en stor mängd människor. Informationen var osorterad, på så sätt att forskarna inte talade om för det artificiella neurala nätverket vilka genuttryck som kom från personer med sjukdom, och vad som var kopplat till friska personer. Sedan tränades AI-modellen i att hitta mönster i genuttrycket.
En av utmaningarna med maskininlärning är att människan inte kan se exakt hur ett artificiellt neuralt nätverk löser en uppgift. AI beskrivs ibland som en ”svart låda” – vi ser bara informationen som vi stoppar in i ”lådan” och resultatet som kommer ut, men inte stegen däremellan. Artificiella neurala nätverk består av flera lager där informationen bearbetas matematiskt. Det finns ett inmatningslager, ett utdatalager som levererar resultatet av AI-systemets bearbetning av informationen, och däremellan ett antal dolda lager där en mängd beräkningar utförs. När forskarna hade tränat det artificiella neurala nätverket, undrade de därför om de så att säga kunde glänta på locket till ”svarta lådan” och förstå hur det fungerade. Fanns det likheter mellan det neurala nätverkets uppbyggnad och de biologiska nätverk som redan är kända?Mika Gustafsson.
– När vi analyserade vårt neurala nätverk visade det sig att det första dolda lagret i stor utsträckning representerade interaktioner mellan olika proteiner. I det tredje dolda lagret däremot, djupare in i modellen, återfinns grupper med olika celltyper. Det är väldigt intressant att den sortens biologiskt relevanta grupperingar kommer ut per automatik när vårt nätverk har utgått från oklassificerat genuttrycksdata, säger Mika Gustafsson, universitetslektor vid IFM, som har lett studien, som publiceras i Nature Communications.
I nästa steg undersökte forskarna om deras modell av genuttryck kunde användas till att avgöra vilket genuttryck som är kopplat till sjukdom och vad som är normalt. De fann stöd för att modellen hittar mönster som är relevanta och stämmer bra med de biologiska mekanismerna i kroppen. Eftersom modellen har tränats på oklassificerad data kan det artificiella neurala nätverket också ha hittat mönster som är helt nya. Forskarnas nästa steg är att undersöka om även sådana, hittills okända mönster, är relevanta ur ett biologiskt perspektiv.
– Vi tror att nyckeln för att komma framåt i forskningen inom fältet är att förstå det neurala nätverket. Dels kan det lära oss nya saker om biologiska sammanhang, exempelvis sjukdomar där många faktorer samspelar. Men vi tror också att vårt tillvägagångssätt ger modeller som lättare kan generaliseras och användas på många olika typer av biologisk information, säger Mika Gustafsson.
Genom nära samarbete med forskare inom medicin hoppas Mika Gustafsson kunna göra tillvägagångssättet i studien tillämpbart inom precisionsmedicin, för att exempelvis gruppera vilken patient som bör få vilken medicin eller vem som har svårast sjukdom.
Studien har finansierats med stöd av Stiftelsen för strategisk forskning (SSF) och Vetenskapsrådet.
Artikeln: ”Deriving disease modules from the compressed transcriptional space embedded in a deep autoencoder”, Sanjiv K. Dwivedi, Andreas Tjärnberg, Jesper Tegnér och Mika Gustafsson, Nature Communications, publicerad online 12 februari 2020, doi: 10.1038/s41467-020-14666-6