Kursplanen innehåller ändringar
Se ändringarKursplan fastställd 2018-12-08 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnTechniques for Large-scale Data
- KurskodDAT345
- Omfattning7,5 Högskolepoäng
- ÄgareMPALG
- UtbildningsnivåAvancerad nivå
- HuvudområdeDatateknik, Informationsteknik
- InstitutionDATA- OCH INFORMATIONSTEKNIK
- BetygsskalaTH - Fem, Fyra, Tre, Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 02122
- Max antal deltagare30
- Blockschema
- Sökbar för utbytesstudenterNej
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
---|---|---|---|---|---|---|---|
0117 Tentamen 4 hp Betygsskala: TH | 4 hp |
| |||||
0217 Inlämningsuppgift 3,5 hp Betygsskala: TH | 3,5 hp |
I program
Examinator
- Alexander Schliep
- Forskare, Data Science och AI, Data- och informationsteknik
Behörighet
Information saknasKursspecifika förkunskaper
Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp i databaser, t e TDA357 DatabaserSyfte
Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.Lärandemål (efter fullgjord kurs ska studenten kunna)
Efter godkänd kurs ska studenten kunna:Kunskap och förståelse
- diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
- beskriva datamodeller och mjukvarustandarder för internetdelning av data.
- använda Python för att implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,
- tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
- föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter ochargumentera fördelar och nackdelar med dessa,
- diskutera fördelar och nackdelar med olika strategier för spridning av data,
- diskutera storskalig datahantering utifrån ett etiskt perspektiv.
Innehåll
Kursen kommer att introducera aspekter av design och implementation av storskaliga data science-lösningar.Framför allt kommer kursen att innefatta
- en överblick av datorarkitekturer och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
- en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
- implementering av dataanalysverktyg på ett kluster med hjälp av Python ochlämpliga mjukvaruramverk,
- en överblick över ickerelationella databasteknologier,
- Semantic Web och besläktade teknologier,
- en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.
Organisation
Föreläsningar, datorlaborationer och övningar.Litteratur
Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.Examination inklusive obligatoriska moment
Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter.Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.
Kursplanen innehåller ändringar
- Ändring gjord på kurstillfälle:
- 2018-11-16: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
[Kurstillfälle 1] - 2018-10-31: Block Block ändrat från B+ till A av Schemagruppen
[Kurstillfälle 1] - 2018-04-06: Block Block ändrat från B till B+ av Examinator via schema
[Kurstillfälle 1]
- 2018-11-16: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
- Ändring gjord på tentamen:
- 2019-07-03: Plats Plats ändrat från Johanneberg till SB Multisal av grunnet
[2019-08-23 4,0 hp, 0117] - 2019-03-28: Plats Plats ändrat från Johanneberg till Samhällsbyggnad av grunnet
[2019-06-05 4,0 hp, 0117] - 2018-11-19: Tentamensdatum Tentamensdatum ändrat från 2019-06-07 Eftermiddag till 2019-06-05 Förmiddag av Schemagruppen
[2019-06-07 4,0 hp, 0117]
- 2019-07-03: Plats Plats ändrat från Johanneberg till SB Multisal av grunnet
- Ändring gjord på kurstillfälle i programplan:
- 2018-03-19: Borttaget [MPSOF, Årskurs 1 regel V] Kurstillfälle 1 borttaget av UOL/PA
- 2018-03-19: Borttaget [MPSOF, Årskurs 1 regel V] Kurstillfälle 1 borttaget av UOL/PA
- Ändring gjord på kurs:
- 2018-12-07: Examination Examination ändrat av PA
Omformulering av text under Examination
- 2018-12-07: Examination Examination ändrat av PA