Kursplan för Tekniker för storskalig datahantering

Kursplanen innehåller ändringar
Se ändringar

Kursplan fastställd 2018-12-08 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnTechniques for Large-scale Data
  • KurskodDAT345
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPALG
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeDatateknik, Informationsteknik
  • InstitutionDATA- OCH INFORMATIONSTEKNIK
  • BetygsskalaTH - Fem, Fyra, Tre, Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 02122
  • Max antal deltagare30
  • Blockschema
  • Sökbar för utbytesstudenterNej

Poängfördelning

0117 Tentamen 4 hp
Betygsskala: TH
4 hp
  • 05 Jun 2019 fm SB
  • 23 Aug 2019 em SB_MU
0217 Inlämningsuppgift 3,5 hp
Betygsskala: TH
3,5 hp

    I program

    Examinator

    Gå till kurshemsidan (Öppnas i ny flik)

    Behörighet

    Information saknas

    Kursspecifika förkunskaper

    Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp i databaser, t e TDA357 Databaser

    Syfte

    Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.

    Lärandemål (efter fullgjord kurs ska studenten kunna)

    Efter godkänd kurs ska studenten kunna:

    Kunskap och förståelse
    • diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
    • beskriva datamodeller och mjukvarustandarder för internetdelning av data.
    Färdigheter och förmåga
    • använda Python för att implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,
    • tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
    Värderingsförmåga och förhållningssätt
    • föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter ochargumentera fördelar och nackdelar med dessa,
    • diskutera fördelar och nackdelar med olika strategier för spridning av data,
    • diskutera storskalig datahantering utifrån ett etiskt perspektiv.

    Innehåll

    Kursen kommer att introducera aspekter av design och implementation av storskaliga data science-lösningar.
    Framför allt kommer kursen att innefatta
    • en överblick av datorarkitekturer och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
    • en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
    • implementering av dataanalysverktyg på ett kluster med hjälp av Python ochlämpliga mjukvaruramverk,
    • en överblick över ickerelationella databasteknologier,
    • Semantic Web och besläktade teknologier,
    • en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.

    Organisation

    Föreläsningar, datorlaborationer och övningar.

    Litteratur

    Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.

    Examination inklusive obligatoriska moment

    Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter.

    Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.

    Kursplanen innehåller ändringar

    • Ändring gjord på kurstillfälle:
      • 2018-11-16: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
        [Kurstillfälle 1]
      • 2018-10-31: Block Block ändrat från B+ till A av Schemagruppen
        [Kurstillfälle 1]
      • 2018-04-06: Block Block ändrat från B till B+ av Examinator via schema
        [Kurstillfälle 1]
    • Ändring gjord på tentamen:
      • 2019-07-03: Plats Plats ändrat från Johanneberg till SB Multisal av grunnet
        [2019-08-23 4,0 hp, 0117]
      • 2019-03-28: Plats Plats ändrat från Johanneberg till Samhällsbyggnad av grunnet
        [2019-06-05 4,0 hp, 0117]
      • 2018-11-19: Tentamensdatum Tentamensdatum ändrat från 2019-06-07 Eftermiddag till 2019-06-05 Förmiddag av Schemagruppen
        [2019-06-07 4,0 hp, 0117]
    • Ändring gjord på kurstillfälle i programplan:
      • 2018-03-19: Borttaget [MPSOF, Årskurs 1 regel V] Kurstillfälle 1 borttaget av UOL/PA
    • Ändring gjord på kurs:
      • 2018-12-07: Examination Examination ändrat av PA
        Omformulering av text under Examination