Kursplan för Inlärning från data

Kursplan fastställd 2024-01-31 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnLearning from data
  • KurskodTIF285
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPPHS
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeTeknisk fysik
  • InstitutionFYSIK
  • BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 85114
  • Max antal deltagare60 (minst 10% av platserna reserveras för utbytesstudenter)
  • Blockschema
  • Sökbar för utbytesstudenterJa

Poängfördelning

0119 Projekt 7,5 hp
Betygsskala: TH
7,5 hp

I program

Examinator

Gå till kurshemsidan (Öppnas i ny flik)

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

  • Kunskaper i matematik på kandidatnivå (flervariabelanalys, linjär algebra, matematisk statistik)
  • Programmeringskunskaper (programmeringsspråket Python kommer att användas i kursen)
  • Allmän fysikkunskap (för en djupare förståelse av de vetenskapliga exempel som kommer att studeras)

Syfte

Kursen syftar till att ge studenterna en djupare teoretisk förståelse samt praktisk erfarenhet av arbetsflöden och centrala algoritmer inom vetenskaplig modellering, statistisk inferens och maskininlärning. Fokus ligger på probabilistiska metoder inom ingenjörs- och naturvetenskap, som till exempel förmågan att kunna kvantifiera styrkan hos induktiv inferens från förkunskaper och experimentella data till vetenskapliga hypoteser och modeller.

Kursen är projektbaserad och studenterna kommer att exponeras för modernt naturvetenskapligt forsknings- och utvecklingsarbete. Mer specifikt kommer forskningsrelevanta hemuppgifter och projekt att genomföras med programmeringsspråket Python i kombination med användbara, och fritt tillgängliga, programbibliotek. Ett delsyfte är att lära studenterna att utveckla och strukturera både arbetsflöden och datorprogram för att på egen hand kunna genomföra pålitlig modellering och dataanalys.

Lärandemål (efter fullgjord kurs ska studenten kunna)

- planera och utföra vetenskaplig dataanalys med metoder från Bayesiansk statistik.
- simulera multivariata sannolikhetsfördelningar med MCMC-metoder.
- kritiskt granska och kvantifiera osäkerheter hos modellparametrar från en statistisk dataanalys.
- förstå och numeriskt implementera flera probabilistiska metoder som används inom dataanalys och maskininlärning.
- adressera öppna frågeställningar inom vetenskaplig dataanalys och genomföra numeriska studier med Python som programmeringsspråk.
- skriva välstrukturerade tekniska rapporter med presentation av resultat och slutsatser från en vetenskaplig dataanalys.
- vidhålla ett vetenskapligt och etiskt arbetssätt i processen att genomföra modellering, analysera data och att skriva datorprogram.

Innehåll

Kursen består av två huvudsakliga delar:
1. Bayesiansk inferens och arbetsflöden inom vetenskaplig modellering
2. (Probabilistiska) maskininlärningsmetoder

Följande ämnen kommer att behandlas:
- Statistiska modeller
- Bayesiansk statistik och metodologi
- MCMC simulering
- Icke-linjära modeller och optimering
- Gaussprocesser
- (Bayesianska) neurala nätverk

Organisation

- Föreläsningar
- Handledda grupparbeten med numeriska projekt
- Analytiska och numeriska hemuppgiftsproblem
- Beräkningsprojekt med skriftlig rapportredovisning

Litteratur

Kompendium.

Extra litteratur:
Phil Gregory, Bayesian Logical Data Analysis for the Physical Sciences, Cambridge University Press, 2010
D.S. Sivia, Data analysis---a Bayesian tutorial, Oxford Science Publications, 2006
David J.C. MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 4th printing, 2005
Trevor Hastie, Robert Tibshirani, Jerome H. Friedman, The Elements of Statistical Learning, Springer, 2nd edition, 2009
Andrew Gelman et al, Bayesian Data Analysis, CRC Press, 3rd edition, 2014
Aurelien Geron, Hands‑On Machine Learning with Scikit‑Learn and TensorFlow, O'Reilly, 1st edition, 2017

Examination inklusive obligatoriska moment

Slutbetyget bestäms genom en kombination av resultaten på hemuppgifterna och de skriftliga rapporterna.

Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om pedagogiskt stöd på grund av funktionsnedsättning.