Kursplan för Maskininlärning för språkteknologi

Kursplan fastställd 2026-02-18 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnMachine learning for natural language processing
  • KurskodDAT450
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPDSC
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeInformationsteknik
  • InstitutionDATA- OCH INFORMATIONSTEKNIK
  • BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från kravet

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från kraven

Kursspecifika förkunskaper

Kursen kräver 7,5 hp i programmering, 7,5 hp i sannolikhetsteori eller statistik, samt en första kurs i maskininlärning, t.ex. DAT340, TDA233, SSY340 eller MVE440.

Syfte

Kursen ger en introduktion till maskininlärningsmodeller och arkitekturer som används i moderna system inom språkteknologi.

Lärandemål (efter fullgjord kurs ska studenten kunna)

Kunskap och förståelse:
  • beskriva de vanligaste typerna av uppgifter inom naturlig språkbehandling,
  • beskriva de vanligaste typerna av maskininlärningsmodeller och träningsalgoritmer som används i modern naturlig språkbehandling och stora språkmodeller,
  • förklara hur textdata kan annoteras för en uppgift inom naturlig språkbehandling där maskininlärning används.
Färdighet och förmåga:
  • använda programvarubibliotek som utnyttjar maskininlärning för vanliga uppgifter inom naturlig språkbehandling,
  • använda programvarubibliotek för att ladda förtränade stora språkmodeller och anpassa dessa modeller,
  • skriva kod för att implementera maskininlärningsmodeller för naturlig språkbehandling och stora språkmodeller,
  • tillämpa utvärderingsmetoder för att bedöma kvaliteten hos system för naturlig språkbehandling och stora språkmodeller.
Värderingsförmåga och förhållningssätt:
  • diskutera för- och nackdelar med olika maskininlärningsmodeller med avseende på en given uppgift inom naturlig språkbehandling,
  • resonera kring vilken typ av data som kan vara användbar vid träning av en modell för en viss uppgift inom naturlig språkbehandling,
  • välja lämplig utvärderingsmetodik för ett system för ett system för naturlig språkbehandling och motivera detta val,
  • resonera kring etiska frågor som rör maskininlärningsbaserade system för naturlig språkbehandling, såsom stereotyper och underrepresentation.

Innehåll

Detta är en forskningsinriktad teknisk kurs som behandlar de tekniska lösningarna bakom moderna NLP-teknologier och stora språkmodeller.

Kursen omfattar följande huvudområden:

• praktiskt arbete med textdata, inklusive grundläggande uppgifter som tokenisering;
• probabilistiska modeller för text, såsom ämnesmodeller;
• översikt över de vanligaste typerna av NLP-tillämpningar;
• maskininlärningsarkitekturer i NLP-modeller, inklusive ordinbäddningar, rekurrenta nätverk och Transformers;
• användning av promptbaserade stora språkmodeller via APIer och lokalt;
• förträning av representationsmodeller och stora språkmodeller;
• anspassning av modeller för instruktionsföljande och resonerande.

Organisation

Undervisningen består av onlineföreläsningar som ses före lektionstillfällena, aktiva lärandepass där vi reflekterar över materialet från den aktuella föreläsningen, samt datorövningar.

Inga moment med obligatorisk närvaro.

Litteratur

Jurafsky & Martin, Speech and Language Processing.

För att kunna använda den senaste materialet rekommenderas att man använder onlineversionen: https://web.stanford.edu/~jurafsky/slp3/


Examination inklusive obligatoriska moment

Examinationen består av inlämningsuppgifter, varav vissa löses individuellt och andra i grupp, ett avslutande grupprojekt som redovisas muntligt och med skriftlig rapport, samt duggor som används för att utvärdera vad studenterna lärt sig under kursens olika moment.

Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om riktat pedagogiskt stöd på grund av funktionsnedsättning.