MVEX01-14-12 Regressionsmodeller vid överlevnadsanalys av fastyp

Fastypsfördelningar är en klass av sannolikhetsfördelningar för positiva stokastiska variabler som har en hel del attraktiva egenskaper. Klassen kan användas för att approximera andra positiva stokastiska variabler med önskad precision samtidigt som sannolikhetstätheten, fördelningsfunktionen och felintensiteten för en fastypsfördelad stokastisk variabel kan uttryckas i explicita formler i termer av matrisexponentiella funktioner. Vidare är Laplacetransformer momentgenererande funktioner och godtyckliga moment också möjliga att beräkna, numeriskt med till exempel Matlab eller alternativt analytiskt med hjälp av formelmanipulerande program såsom Maple eller Matematica.
 
Den enklaste beskrivningen av en fastypsfördelning är att det är en fördelning som beskriver absorptionstiden för en kontinuerlig tids Markovkedja med ett ändligt tillståndsrum med ett enda absorberande tillstånd och en godtycklig startfördelning över de tillstånd som inte är absorberande. Ordningen på en fastypsfördelning är antalet icke-absorberande tillstånd i beskrivningen ovan. Klassen rymmer som specialfall en hel del klassiska sannolikhetsfördelningar såsom exponentialfördelning, gammafördelning med heltalsvärda formparametrar, Erlangfördelningar och så kallade Coxianska fördelningar.
 
För drygt 15 år sedan utvecklade några av oss på matematisk statistik, Chalmers/GU, en teknik att maximum likelihoodskatta parametrarna i en fastypsfördelning, dokumenterade i ett datorprogram som kallas EMPHT, som baseras på en mycket vanlig statistisk optimeringsteknik som kallas EM-algoritmen. Metoden bygger på att man å ena sidan vet hur man skulle ha skattat fastypsfördelningens parametrar vid observation av alla detaljer i den underliggande Markovprocessen och å andra sidan hur man skulle "predikterat" vilket tillstånd man befann sig i vid varje tidpunkt innan den observerade absorptionen, med hjälp av betingning om alla parametrar vore helt kända. Sedan itererar man mellan dessa beräkningar genom att väga med de provisoriska tillstånds-sannolikheterna i M-steget (maximeringssteget) är de sanna parametrarna och använda de provisoriska parameterskattningarna, eller snarare väga med prediktionssannolikheter, som om de vore kända i E-steget (expectation-steget). I den speciella modellstrukturen bakom fastypsfördelningar kan man tyvärr inte alltid vara säker på att man får konvergens i algoritmen mot ett globalt optimum, man kan fastna i lokala optima eller ibland även i sadelpunkter.
 
Här kan man tänka sig att modellera på två ganska olika sätt, dels kan man accelerera tiden för underliggande Markovprocessen rakt över, dels genom att bara modifiera intensiteterna för direktabsorption från alla icke-absorberande tillstånd med samma multiplikativa konstanter som beror av en kovariantvariabel eller av grupptillhörighet. Projektet innebär att man både sätter sig in i livslängdsanalyser av regressionstyp och naturligtvis teorin för fastypsfördelningar. Typiskt kräver detta också att man modifierar den existerande EMPHT-programvaran. (Kräver nog aningen mer förkunskaper inom matematisk statistik än 2 nedan MVEX01-14-13). Här är tanken att man skall jämföra i slutänden med så kallade Cox-regressionsanalyser på klassiska datamaterial. Det finns ett antal översiktsuppsatser som skrivits om användande av fastypsfördelningar i medicinska sammanhang men ingen särskilt omfattande existerande litteratur om frågeställningen.

I båda projekten kan man tänka sig att skräddarsy svårighetsnivån efter gruppens samlade förkunskaper.

Projektkod MVEX01-14-12
Gruppstorlek 3-4
Speciella förkunskapskrav Grundkurs i statistik.
Handledare Olle Nerman
Examinator Maria Roginskaya
Institution Matematiska vetenskaper

Publicerad: sö 27 okt 2013. Ändrad: to 14 feb 2019