Kursplan för Tekniker för storskalig datahantering

Kursplanen innehåller ändringar
Se ändringar

Kursplan fastställd 2018-12-08 av programansvarig (eller motsvarande).

Kursöversikt

 • Engelskt namnTechniques for Large-scale Data
 • KurskodDAT345
 • Omfattning7,5 Högskolepoäng
 • ÄgareMPALG
 • UtbildningsnivåAvancerad nivå
 • HuvudområdeDatateknik, Informationsteknik
 • InstitutionDATA- OCH INFORMATIONSTEKNIK
 • BetygsskalaTH - Fem, Fyra, Tre, Underkänd

Kurstillfälle 1

 • Undervisningsspråk Engelska
 • Anmälningskod 02122
 • Max antal deltagare30
 • Blockschema
 • Sökbar för utbytesstudenterNej

Poängfördelning

0117 Tentamen 4 hp
Betygsskala: TH
4 hp
 • 05 Jun 2019 fm SB
 • 23 Aug 2019 em SB_MU
0217 Inlämningsuppgift 3,5 hp
Betygsskala: TH
3,5 hp

  I program

  Examinator

  Gå till kurshemsidan (Öppnas i ny flik)

  Behörighet

  Information saknas

  Kursspecifika förkunskaper

  Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp i databaser, t e TDA357 Databaser

  Syfte

  Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.

  Lärandemål (efter fullgjord kurs ska studenten kunna)

  Efter godkänd kurs ska studenten kunna:

  Kunskap och förståelse
  • diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
  • beskriva datamodeller och mjukvarustandarder för internetdelning av data.
  Färdigheter och förmåga
  • använda Python för att implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,
  • tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
  Värderingsförmåga och förhållningssätt
  • föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter ochargumentera fördelar och nackdelar med dessa,
  • diskutera fördelar och nackdelar med olika strategier för spridning av data,
  • diskutera storskalig datahantering utifrån ett etiskt perspektiv.

  Innehåll

  Kursen kommer att introducera aspekter av design och implementation av storskaliga data science-lösningar.
  Framför allt kommer kursen att innefatta
  • en överblick av datorarkitekturer och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
  • en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
  • implementering av dataanalysverktyg på ett kluster med hjälp av Python ochlämpliga mjukvaruramverk,
  • en överblick över ickerelationella databasteknologier,
  • Semantic Web och besläktade teknologier,
  • en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.

  Organisation

  Föreläsningar, datorlaborationer och övningar.

  Litteratur

  Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.

  Examination inklusive obligatoriska moment

  Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter.

  Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.

  Kursplanen innehåller ändringar

  • Ändring gjord på kurstillfälle:
   • 2018-11-16: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
    [Kurstillfälle 1]
   • 2018-10-31: Block Block ändrat från B+ till A av Schemagruppen
    [Kurstillfälle 1]
   • 2018-04-06: Block Block ändrat från B till B+ av Examinator via schema
    [Kurstillfälle 1]
  • Ändring gjord på tentamen:
   • 2019-07-03: Plats Plats ändrat från Johanneberg till SB Multisal av grunnet
    [2019-08-23 4,0 hp, 0117]
   • 2019-03-28: Plats Plats ändrat från Johanneberg till Samhällsbyggnad av grunnet
    [2019-06-05 4,0 hp, 0117]
   • 2018-11-19: Tentamensdatum Tentamensdatum ändrat från 2019-06-07 Eftermiddag till 2019-06-05 Förmiddag av Schemagruppen
    [2019-06-07 4,0 hp, 0117]
  • Ändring gjord på kurstillfälle i programplan:
   • 2018-03-19: Borttaget [MPSOF, Årskurs 1 regel V] Kurstillfälle 1 borttaget av UOL/PA
  • Ändring gjord på kurs:
   • 2018-12-07: Examination Examination ändrat av PA
    Omformulering av text under Examination