AI hjälper forskare förstå cellernas maskineri

08 februari 2023

Karin Söderlund Leifler

En av de stora utmaningarna inom biologi har länge varit att knäcka koden för varför ett protein får en specifik form. För ett par år sedan ledde artificiell intelligens, AI, till ett genombrott inom fältet. I Björn Wallners forskning möts AI och bioinformatik.

Två män i labbrockar med en dator i ett labb. Claudio Mirabello är en av forskarna som Björn Wallner samarbetar med. De kombinerar datormodellernas förutsägelser med experiment för att bättre förstå hur olika proteiner ser ut och interagerar med varandra. Foto Thor Balkhed

I princip allt i kroppen är beroende av proteiner. De utgör byggstenarna som är stommen i våra celler och får cellerna att hålla ihop i vävnader. Men kanske ännu viktigare är att proteiner är cellernas maskiner. Allt från att skicka signaler inom och mellan celler, reparera skador på dna och reglera blodsockret sköts av proteiner. Ofta krävs ett komplext maskineri bestående av många olika proteiner som kommer samman vid rätt tidpunkt, gör sin grej, och sedan löses upp.

– För att förstå livet, både i det friska normaltillståndet och vid olika sjukdomar, behöver vi förstå hur proteiner samverkar med varandra. Det är den interaktionen, hur proteiner pratar med varandra, som vi vill få en inblick i genom vår forskning, säger Björn Wallner, professor i bioinformatik vid Institutionen för fysik, kemi och biologi, IFM, vid LiU.

LiU-forskarna utvecklar datormodeller för att kunna förstå hur proteiner ser ut och växelverkar med varandra. De applicerar sedan sina metoder i projekt tillsammans med forskarkollegor som gör experiment.

En av de stora frågorna

Den mänskliga kroppen har runt 20 000 olika proteiner. I grunden är ett protein en lång kedja av 20 olika så kallade aminosyror, som sitter ihop likt pärlor i ett halsband. Men proteinets funktion avgörs av hur denna kedja veckas ihop till en 3-dimensionell form. Björn Wallner gestikulerar medan han pratar. Björn Wallner leder en forskargrupp som arbetar med strukturell bioinformatik, som ingår i det stora forskningsfältet data-driven life science. Foto Thor Balkhed

– Det är ganska lätt att få fram i vilken ordning aminosyrorna sitter, det som vi kallar proteinsekvensen. Men hur proteinets 3-dimensionella struktur ser ut är mycket svårare att ta reda på, säger Björn Wallner.

Problemet att utifrån aminosyrasekvensen räkna ut vilken form ett protein har är något som forskare har brottats med i ungefär 50 år. I dag bedrivs forskningen med datorer, i vilka forskarna skapar modeller och utför de omfattande beräkningarna som krävs. Vartannat år kan forskare jämföra sina metoder och testa vilka som är bäst i den internationella utvärderingen CASP (Critical Assessment of protein Structure Prediction). Björn Wallner är en av många forskare som deltagit i utvärderingen. Alla deltagare har fått ett antal proteinsekvenser skickade till sig och använt sina egna datormodeller för att försöka förutsäga proteinernas struktur.

Men år 2020 hände något. Google-företaget DeepMind presenterade sin senaste version av en artificiell intelligens, AI, som utvecklats för att förutsäga proteinstrukturer – AlphaFold. DeepMind hade några år tidigare utvecklat en AI som kan spela go (ett strategiskt brädspel som spelats i asiatiska länder i mer än 2 500 år) bättre än en professionell go-spelare. I jämförelsen med andra modeller för att räkna ut proteinstruktur var AlphaFold överlägsen på CASP det året.

– Det är en revolution inom strukturbiologi. AlphaFold är en av de första AI-baserade metoderna som löser ett stort problem inom biologi. De löste i princip problemet med att förutsäga strukturen för enskilda proteiner, säger Björn Wallner.

LiU-modellen i toppskiktet

Sommaren 2021 släpptes AlphaFold som öppen källkod och metoden bakom AI:n publicerades i den vetenskapliga tidskriften Nature. Därmed blev AI:n tillgänglig för alla att använda. Vid nästa CASP-utvärdering hade alla deltagande forskargrupper utvecklat AlphaFold vidare, eftersom den var så bra. I jämförelsen i december 2022 visade det sig att Björn Wallners modell låg i toppen i kategorin som går ut på att förutsäga interaktioner mellan flera olika proteiner.Björn Wallner. Foto Thor Balkhed

– Det är stort att vi kan konkurrera med stora grupper över hela världen, som har mycket större resurser.

Björn Wallners vidareutveckling av AlphaFold bygger på en enkel princip.

– Jag insåg att AlphaFold låste sig vid sin första gissning, även om man upprepade körningen flera gånger. Man skulle vilja att den gör lite olika gissningar, för den första kanske inte är rätt. Därför tvingade jag AI:n att göra fler gissningar genom att jag införde slumpvisa störningar.

En stor fördel med AlphaFold är att AI:n är väldigt bra på att utvärdera sig själv och säga hur bra dess gissning är, menar Björn Wallner. Därför ville han få modellen att generera fler möjliga strukturer och att välja ut de som är allra bäst.

– Det är en enkel princip och det gör att alla andra kan göra på samma sätt nu. Min kod finns tillgänglig för alla att köra. En forskargrupp som enbart är intresserad av några få proteiner kan göra beräkningarna på en vanlig dator med ett eller flera bra grafikkort.

Kan ge forskning en skjuts framåt

Han tror att många inom fältet kommer att anamma hans strategi i sina modeller, mycket tack vare dess enkelhet. Modellen har redan visat sig vara användbar i några av hans forskningssamarbeten. Han tror att den framför allt kan visa sig bli ett effektivt redskap för forskare som är intresserade av proteiner som har flera olika former och interagerar med flera olika proteiner.

Det har redan hänt att AI-modellen har lett till upptäckter av nya interaktionsytor där två proteiner interagerar med varandra.

– Vi trodde först att det var något fel i körningen. Men eftersom modellen är så bra på att bedöma sina gissningar, så dubbelkollade vi resultatet med flera experimentella metoder. Det visade sig att modellen hade rätt och att det var ett alternativt bindningsställe som ingen hittat förut. Så jag tror att modellen har många användningsområden inom forskningen.

Mer information om CASP hittar du här.

Mer om forskningen

Teori och modellering

Driver vetenskapen framåt genom matematisk modellering och datorsimuleringar

Senaste nytt från LiU

Startups möter försvarsindustrin i prisat exjobb

Startup-företag står för snabbhet och nya, smarta lösningar. Hur matchar det med tillverkningsindustrin? Civilingenjörerna Matilda Kristensen och Silje Graarud får Christer Giléns stipendium för sin masteruppsats.

Professor Maria Brandén framför en dörr.

Slump och samband – så blev Maria Brandén sociolog

Sociologen Maria Brandén studerar samhället ur fågelperspektiv. Som ledare för Institutet för analytisk sociologi vid Linköpings universitet vill hon skapa forskning som påverkar viktiga politiska beslut.

Kollage med två porträttbilder (Jendrik Seipp och Zhang Chen).

Nya Wallenberg Academy Fellows forskar på 6G och AI

LiU-forskarna Jendrik Seipp och Zheng Chen har blivit utsedda till nya Wallenberg Academy Fellows. Finansieringen, som stäcker sig över fem år, ger lovande forskare möjlighet att ta sig an svåra forskningsfrågor som kräver lång tid.