Ny handbok inom forensisk statistik

​För 20 år sedan skapades datorprogrammet Familias av Petter Mostad, docent i matematisk statistik på Matematiska vetenskaper, och Thore Egeland. Det är idag ett av världens mest använda program när DNA-laboratorier ska fastställa faderskap och andra släktband. Den 6 januari i år kom uppföljningen: en bok som är dels en handbok för Familias, och dels vänder sig till forskare inom området.

Relation Inference with Familias and R– Om man har bra data, som ett blodprov, så kan man idag nästan alltid vara säker på att kunna identifiera nära släktband med hjälp av DNA. Men när man har sämre eller ofullständiga data eller undersöker mer avlägsna släktband så måste man räkna på det, man måste använda statistik. Ta till exempel när man hittade graven med vad man trodde kunna vara kvarlevorna från den ryska tsarfamiljen Romanov. Då kunde man med hjälp av forensisk statistik dels se om de olika kropparna varit släkt med varandra, dels om de varit av släkten Romanov.

Det var alltså i början av 1990-talet som Thore Egeland och Petter Mostad började med att modellera mutationer vid faderskap, vilket ledde till programmet Pater som senare blev Familias. Thore är professor i statistik vid Norges miljö- och biovetenskapliga universitet, och bokens tredje medförfattare Daniel Kling arbetar på Folkehelseinstituttet i Norge. Boken börjar som en hjälp för de som ska använda sig av programmet och blir sedan alltmer matematiskt avancerad och forskningsinriktad. Hela boktiteln lyder ”Relationship Inference with Familias and R – Statistical Methods in Forensic Genetics” och ”relationship inference” betyder då hur människor är besläktade.

Petter MostadForskningsområdet är nära kopplat till DNA i andra forensiska sammanhang, då man ska hitta misstänkta brottslingar, vilka använder sig av besläktade metoder. Det är dock inget som tas upp i denna bok. Däremot talar man en del om ”disaster victim identification”, DVI. Det handlar då om att identifiera kroppar vid naturkatastrofer som t ex den stora tsunamin. Forensisk statistik använder sig mycket av Bayesiansk statistik, ett väldigt grundläggande område inom statistiken, men också av beslutsteori, populationsgenetik och olika algoritmer för beräkningar av större analyser – det kan bli väldigt mycket data som ska behandlas. Det ”R” som också finns i boktiteln är ett programmeringsspråk som är det vanligaste specialverktyget inom matematisk statistik.

– Forensisk statistik ska ofta användas i rätten, så man måste ofta dela upp resultaten på ett sådant sätt att även lekmän förstår. Modellerna måste vara så oangripliga som möjligt eftersom de blir skärskådade in i minsta detalj, och det är en stor utmaning att kunna kommunicera dem så att man i möjligaste mån kan slippa förvirring om resultatens giltighet. Nu ska det bli väldigt spännande att se hur boken tas emot!

Text: Setta Aspström
Foto: Setta Aspström och Petter Mostad


Sidansvarig Publicerad: må 29 apr 2019.