Projektet leds av Domstolsverket i samarbete med Linköpings universitet (LiU), Totalförsvarets forskningsinstitut (FOI) och Polismyndigheten. AI Academy-deltagarna Nils Alenäs, Aleksi Maxim Andreev and Victor Lagerbring arbetar i projektet. Målet är att automatisera skyddet och anonymiseringen av känslig information i juridiska dokument.
Idag görs anonymisering, även kallad “maskning”, manuellt av jurister och administrativ personal. Det är en tidskrävande och resursintensiv process. Om den automatiseras kan det frigöra tid för juridiska experter och samtidigt göra processen snabbare, mer exakt och enhetlig mellan olika domstolar. Om projektet lyckas kan lösningen även användas av stora företag, myndigheter och försvar, vilket skulle förändra hur känslig data hanteras i samhället.
Projektet använder AI-teknik baserad på Swedish BERT, en språkmodell som är tränad för att förstå svenska texter. Den kombineras med NER (Named Entity Recognition) – en metod för att hitta specifik information i text, till exempel personnamn (PERSON), organisationer (ORG), platser (LOC) och koder. När dessa uppgifter identifierats anonymiseras de med metoder som pseudonymisering, det vill säga ersätta riktiga namn med påhittade, och formatbevarande maskning, det vill säga behålla samma struktur så att dokumentet ser naturligt ut. Om systemet är osäkert görs en manuell kontroll för att säkerställa korrekt anonymisering.
Eftersom juridiska dokument innehåller mycket konfidentiell information kommer systemet endast att användas inom varje enskild domstol. Det kommer inte att dela data mellan domstolar. AI:n tränas enbart på offentlig och syntetisk data och aldrig på verkliga domstolsärenden, för att garantera full integritet.
För att säkerställa hög kvalitet utvärderas systemet med mått som precision, recall och F1-score. Dessa är standardmått inom AI som visar hur bra systemet är på att hitta och anonymisera känslig information. Tillsammans med återkoppling från användare hjälper dessa tester till att garantera att slutprodukten blir både noggrann och pålitlig, minskar arbetsbördan och stärker rättssäkerheten.