Kursplanen innehåller ändringar
Se ändringarKursplan fastställd 2020-02-20 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnTechniques for large-scale data
- KurskodDAT346
- Omfattning7,5 Högskolepoäng
- ÄgareMPDSC
- UtbildningsnivåAvancerad nivå
- HuvudområdeDatateknik, Informationsteknik
- InstitutionDATA- OCH INFORMATIONSTEKNIK
- BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 87112
- Max antal deltagare100
- Blockschema
- Sökbar för utbytesstudenterNej
- Endast studenter med kurstillfället i programplan.
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
---|---|---|---|---|---|---|---|
0119 Tentamen 4 hp Betygsskala: TH | 4 hp |
| |||||
0219 Inlämningsuppgift 3,5 hp Betygsskala: UG | 3,5 hp |
I program
- MPALG - DATAVETENSKAP - ALGORITMER, PROGRAMSPRÅK OCH LOGIK, MASTERPROGRAM, Årskurs 1 (valbar)
- MPDSC - DATA SCIENCE OCH AI, MASTERPROGRAM, Årskurs 1 (obligatoriskt valbar)
Examinator
- Graham Kemp
- Biträdande professor, Data Science och AI, Data- och informationsteknik
Behörighet
Grundläggande behörighet för avancerad nivåSökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Särskild behörighet
Engelska 6Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Kursspecifika förkunskaper
Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp, t. ex. TDA357 Databaser.Syfte
Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.Lärandemål (efter fullgjord kurs ska studenten kunna)
Efter godkänd kurs ska studenten kunna:Kunskap och förståelse
- diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
- diskutera indexstrukturer och nyttan med dem,
- beskriva datamodeller och mjukvarustandarder för internetdelning av data.
- implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,,
- tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
- föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter och argumentera fördelar och nackdelar med dessa,
- diskutera metoder för parallellism och återställning i databassystem,
- diskutera effektiviteten för sökfrågeplaner,
- diskutera storskalig datahantering utifrån ett etiskt perspektiv.
Innehåll
Framför allt kommer kursen att innefatta- en överblick av datorarkitekturer, algoritmiska tillvägagångssätt, och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
- en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
- implementering av dataanalysverktyg på ett kluster med hjälp av Python och lämpliga mjukvaruramverk,
- indexstrukturer, hantering och optimering av sökfrågor; parallellism, återställning,
- en överblick över ickerelationella databasteknologier,
- Semantic Web och besläktade teknologier,
- en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.
Organisation
Föreläsningar, datorlaborationer och övningar.Litteratur
Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.Examination inklusive obligatoriska moment
Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter. Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.Kursplanen innehåller ändringar
- Ändring gjord på kurstillfälle:
- 2020-11-05: Max antal deltagare Max antal deltagare ändrat från 30 till 100 av PA
[Kurstillfälle 1] - 2020-01-13: Examinator Examinator ändrat från Alexander Schliep (schliep) till Graham Kemp (kemp) av Viceprefekt
[Kurstillfälle 1]
- 2020-11-05: Max antal deltagare Max antal deltagare ändrat från 30 till 100 av PA