MVEX01-14-13 Undersökning av alternativa metoder för skattning av fastypsfördelningar

Fastypsfördelningar är en klass av sannolikhetsfördelningar för positiva stokastiska variabler som har en hel del attraktiva egenskaper. Klassen kan användas för att approximera andra positiva stokastiska variabler med önskad precision samtidigt som sannolikhetstätheten, fördelningsfunktionen och felintensiteten för en fastypsfördelad stokastisk variabel kan uttryckas i explicita formler i termer av matirisexponentilla funktioner. Vidare är Laplacetransformer momentgenererande funktioner och godtyckliga moment också möjliga att beräkna, numeriskt med till exempel Matlab eller alternativt analytiskt med hjälp av formelmanipulerande program såsom Maple eller Matematica.
 
Den enklaste beskrivningen av en fastypsfördelning är att det är en fördelning som beskriver absorptionstiden för en kontinuerlig tids Markovkedja med ett ändligt tillståndsrum med ett enda absorberande tillstånd och en godtycklig startfördelning över de tillstånd som inte är absorberande. Ordningen på en fastypsfördelning är antalet icke-absorberande tillstånd i beskrivningen ovan. Klassen rymmer som specialfall en hel del klassiska sannolikhetsfördelningar såsom expenentialfördelning, gammafördelning med heltalsvärda formaparameter, Erlangfördelningar och så kallade Coxianska fördelningar.
 
För drygt 15 år sedan utvecklade några av oss på matematisk statistik, Chalmers/GU, en teknik att maximum likelihoodskatta parametrarna i en fastypsfördelning, dokumenterade i ett datorprogram som kallas EMPHT, som baseras på en mycket vanlig statistisk optimeringsteknik som kallas EM-algoritmen. Metoden bygger på att man å ena sidan vet hur man skulle ha skattat fastypsfördelningens parametrar vid observation av alla detaljer i den underliggande Markovprocessen och å andra sidan hur man skulle "predikterat" vilket tillstånd man befann sig i vid varje tidpunkt innan den observerade absorptionen, med hjälp av betingning om alla parametrar vore helt kända. Sedan itererar man mellan dessa beräkningar genom att väga med de provisoriska tillstånds-sannolikheterna i M-steget (maximeringssteget) är de sanna parametrarna och använda de provisoriska parameterskattningarna, eller snarare väga med prediktionssannolikheter, som om de vore kända i E-steget(expectation-steget) . I den speciella modellstrukturen bakom fastypsfördelningar kan man tyvärr inte alltid vara säker på att man får konvergens i algoritmen mot ett globalt optimum, man kan fastna i lokala optima eller ibland även i sadelpunkter.
 
Dels kan man tänka sig helt andra metoder för optimering av likelihoodfunktionen, dels kan man fundera över möjligheterna att effektivisera nuvarande skattningstekniken genom att på ett bättre sätt än vad som görs för närvarande försäkra sig om att man verkligen hittat parametrar som svarar mot globala optima med hjälpa av sin EM-algoritm. Det här projektet är lite mer matematiskt till sin karaktär än MVEX01-14-12. Det finns också en ganska stor litteratur om optimeringar och alternativa skattningstekniker även inom fastypsfördelningsområdet.
 
I båda projekten kan man tänka sig att skräddarsy svårighetsnivån efter gruppens samlade förkunskaper.
 
Projektkod MVEX01-14-13
Gruppstorlek 3-4
Speciella förkunskapskrav Grundkurs i statistik.
Handledare Olle Nerman
Examinator Maria Roginskaya
Institution Matematiska vetenskaper

Publicerad: sö 27 okt 2013. Ändrad: fr 26 apr 2019