Kursplan fastställd 2026-02-18 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnMachine learning for natural language processing
- KurskodDAT450
- Omfattning7,5 Högskolepoäng
- ÄgareMPDSC
- UtbildningsnivåAvancerad nivå
- HuvudområdeInformationsteknik
- InstitutionDATA- OCH INFORMATIONSTEKNIK
- BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 87135
- Max antal deltagare50
- Min. antal deltagare10
- Sökbar för utbytesstudenterNej
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
|---|---|---|---|---|---|---|---|
| 0120 Inlämningsuppgift 7,5 hp Betygsskala: TH | 7,5 hp |
I program
- MPALG - Datavetenskap - algoritmer, programspråk och logik, Årskurs 1 (valbar)
- MPALG - Datavetenskap - algoritmer, programspråk och logik, Årskurs 2 (valbar)
- MPCAS - Komplexa adaptiva system, Årskurs 1 (valbar)
- MPCAS - Komplexa adaptiva system, Årskurs 2 (valbar)
- MPDSC - Data Science och AI, Årskurs 1 (obligatoriskt valbar)
- MPDSC - Data Science och AI, Årskurs 2 (valbar)
- MPENM - Matematik och beräkningsvetenskap, Årskurs 1 (valbar)
- MPENM - Matematik och beräkningsvetenskap, Årskurs 2 (valbar)
- MPSOF - Software engineering and technology - utveckling och implementering av mjukvara, Årskurs 2 (valbar)
Examinator
- Richard Johansson
- Professor (N2), Data Science och AI, Data- och informationsteknik
Behörighet
Grundläggande behörighet för avancerad nivåSökande med en programregistrering på ett program där kursen ingår i programplanen undantas från kravet
Särskild behörighet
Engelska 6Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från kraven
Kursspecifika förkunskaper
Kursen kräver 7,5 hp i programmering, 7,5 hp i sannolikhetsteori eller statistik, samt en första kurs i maskininlärning, t.ex. DAT340, TDA233, SSY340 eller MVE440.Syfte
Kursen ger en introduktion till maskininlärningsmodeller och arkitekturer som används i moderna system inom språkteknologi.Lärandemål (efter fullgjord kurs ska studenten kunna)
Kunskap och förståelse:- beskriva de vanligaste typerna av uppgifter inom naturlig språkbehandling,
- beskriva de vanligaste typerna av maskininlärningsmodeller och träningsalgoritmer som används i modern naturlig språkbehandling och stora språkmodeller,
- förklara hur textdata kan annoteras för en uppgift inom naturlig språkbehandling där maskininlärning används.
- använda programvarubibliotek som utnyttjar maskininlärning för vanliga uppgifter inom naturlig språkbehandling,
- använda programvarubibliotek för att ladda förtränade stora språkmodeller och anpassa dessa modeller,
- skriva kod för att implementera maskininlärningsmodeller för naturlig språkbehandling och stora språkmodeller,
- tillämpa utvärderingsmetoder för att bedöma kvaliteten hos system för naturlig språkbehandling och stora språkmodeller.
- diskutera för- och nackdelar med olika maskininlärningsmodeller med avseende på en given uppgift inom naturlig språkbehandling,
- resonera kring vilken typ av data som kan vara användbar vid träning av en modell för en viss uppgift inom naturlig språkbehandling,
- välja lämplig utvärderingsmetodik för ett system för ett system för naturlig språkbehandling och motivera detta val,
- resonera kring etiska frågor som rör maskininlärningsbaserade system för naturlig språkbehandling, såsom stereotyper och underrepresentation.
Innehåll
Detta är en forskningsinriktad teknisk kurs som behandlar de tekniska lösningarna bakom moderna NLP-teknologier och stora språkmodeller.
Kursen omfattar följande huvudområden:
praktiskt arbete med textdata, inklusive grundläggande uppgifter som tokenisering;
probabilistiska modeller för text, såsom ämnesmodeller;
översikt över de vanligaste typerna av NLP-tillämpningar;
maskininlärningsarkitekturer i NLP-modeller, inklusive ordinbäddningar, rekurrenta nätverk och Transformers;
användning av promptbaserade stora språkmodeller via APIer och lokalt;
förträning av representationsmodeller och stora språkmodeller;
anspassning av modeller för instruktionsföljande och resonerande.
Organisation
Undervisningen består av onlineföreläsningar som ses före lektionstillfällena, aktiva lärandepass där vi reflekterar över materialet från den aktuella föreläsningen, samt datorövningar.
Inga moment med obligatorisk närvaro.
Litteratur
Jurafsky & Martin, Speech and Language Processing.För att kunna använda den senaste materialet rekommenderas att man använder onlineversionen: https://web.stanford.edu/~jurafsky/slp3/
Examination inklusive obligatoriska moment
Examinationen består av inlämningsuppgifter, varav vissa löses individuellt och andra i grupp, ett avslutande grupprojekt som redovisas muntligt och med skriftlig rapport, samt duggor som används för att utvärdera vad studenterna lärt sig under kursens olika moment.Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om riktat pedagogiskt stöd på grund av funktionsnedsättning.
