Nästa Generationens Komparativa Genomik

NÄSTA GENERATIONS SEKVENS-ANALYS Människan är uppbyggd av miljontals små celler. I varje cell finns en komplett kopia av vår genetiska kod, vårt genom, som dels utgör vår arvsmassa och som förs vidare till vår avkomma, och som dels ansvarar för alla funktioner i vår kropp. Arvsmassan sitter kodad i våra kromosomer, som är långa sekvenser av DNA. DNA-sekvensering innebär att man bestämmer den exakta följden av molekyler (eller baser) som utgör våra kromosomer och vår genetiska arvsmassa. Till exempel i människan utgör den sammantagna DNA-sekvensen i en och samma cell över tre miljarder sådana baser. Den nya sekvenseringstekniken, också kallad Nästa Generations Sekvenseringsteknik (NGS), har inneburit en revolution för molekylärbiologer och bioinformatiker. Med NGS kan man numera producera oerhörda mängder sekvensdata på kort tid och till en kostnad som bara är en bråkdel av den för tidigare metoder. Det tog Human Genome Project över ett årtioende, och oerhörda resurser världen över, att sekvensera det mänskliga genomet. Idag kan samma projekt utföras på några månader. Plötsligt ligger det inom räckhåll att sekvensera tusentals olika människor, eller kanske alla arter inom ett givet genus, eller varför inte alla trillioner mikrober som finns i människokroppen. Man kan börja utforska delar av det evolutionära livsträdet som varit helt orörda tidigare, och karakterisera genomen hos helt okända arter, och med okända släktförhållanden till varann. Men med den nya tekniken kommer utmaningarna att skapa ordning och att hitta betydelsen i all data. Behovet av matematiska och datalogiska verktyg som kan hantera datamängden har plötsligt blivit en flaskhals, och utmaningarna är enorma. Komparativ, eller jämförande, genomik innebär att man jämför genomen hos evolutionärt besläktade arter för att identifera likheter i struktur och funktion. Speciellt vid prediktionen av gener i en given sekvens kan jämförelsen av en besläktad sekvens på lagom avstånd förstärka gensignalen och höja prediktionskänsligheten, exempelvis genom att jämföra människa med mus. Komparativ genomik har varit ett hett ämne i över ett årtioende, men den nya sekvenseringstekniken öppnar nya dörrar. Det är plötsligt möjligt att vid analysen av sin favorit-art ställa frågan ``Vilken annan art ska vi sekvensera för att förbättra analysen av den här?´´ Inte heller är man begränsad till att enbart identifiera gener som liknar tidigare kända gener i struktur och funktion. NGS har möjliggjort sekvenseringen av hela transkriptomet i en cell (RNA-Seq data), dvs mängden av alla genprodukter som finns i en specifik cell vid ett givet tillfälle. Förutom att upptäcka nya gener, möjliggör tillgången till RNA-Seq data att man kan studera alla alternativa genprodukter från ett och samma gen-lokus, s.k. alternativ splicing. Målet med det här projektet är att utveckla ett datalogiskt verktyg som integrerar användandet av RNA-Seq data med datalogisk genprediktion. Metoden vi använder är sannolikhetsteoretisk, vilket underlättar både i implementeringen av metoden och i tolkandet av resultaten.

Startdatum 2011-01-01
Slutdatum Projektet är avslutat: 2013-12-31

Publicerad: to 31 maj 2018.