Kursen syftar till att ge forskare verktyg för att mer effektivt använda digitala resurser och tekniker som stöd för forskning och forskningskvalitet. Innehållet omfattar verktyg, tips och metoder som är standard inom såväl akademisk som industriell forskning. Kursen ges av experter från Chalmers e-Commons, Chalmers digitala forskningsinfrastruktur.
Kursupplägg
Kursen består av heldagsworkshoppar en gång i veckan under tio veckor (totalt 10 dagar). Varje tillfälle innehåller föreläsningar, grupp- och individuella övningar samt diskussioner. Fokus ligger på situationer som är relevanta för vetenskaplig forskning, exempelvis dataanalys och visualisering. Den som har en egen datamängd uppmuntras att ta med denna till kursen.
Antal högskolepoäng: 3
Antal deltagare: 20
Lärandemål
Efter genomgången kurs förväntas deltagarna kunna:
- Navigera och automatisera uppgifter i en Linux-miljö
- Utveckla robusta analysflöden som är modulära, underhållbara och reproducerbara, med god praxis för kodstruktur och versionshantering
- Effektivt hantera forskningsdata och analyskod, med strategier för att säkerställa dataintegritet, tillgänglighet och reproducerbarhet genom god dokumentation och metadata
- Använda högpresterande beräkningsresurser för att optimera beräkningsflöden, skala upp analyser och hantera stora datamängder
- Tillämpa maskininlärning för att analysera komplex data, tolka resultat och kommunicera dessa på ett tydligt sätt med hjälp av lämpliga visualiseringar
Behörighet
För att kunna tillgodogöra sig kursen bör deltagaren ha grundläggande förståelse för Python, till exempel kunna definiera en enkel funktion. För den som saknar programmeringsvana ges en 1–2 dagars introduktionskurs i början av hösten för att nå denna nivå. Denna introduktionskurs är öppen för alla forskare vid Chalmers. Alternativt går det bra att göra självstudier via Pythonkursen på W3Schools, upp till modulen om funktioner: https://www.w3schools.com/python/python_functions.asp. Om du är osäker på om du har den nödvändiga kunskapsnivån, rekommenderas att du går igenom W3Schools-materialet.
Innehåll
Följande teman behandlas under kursen:
- Unix shell
- Repetition av Python
- Strukturerad dataanalys
- Hantering av forskningsdata
- Datavisualisering
- Hantering av forskningskod
- Användning av Python Notebooks för kommunikation
- Introduktion till maskininlärning & AI
- Högpresterande beräkningar
- Etiska aspekter av AI
Kursansvarig och examinator
Leon Boschman, kursansvarig
Sverker Holmgren, examinator
Organisation
Heldagsworkshoppar en gång per vecka under 10 veckor. De flesta uppgifter är baserade på faktisk data och deltagarna uppmuntras att ta med egen datamängd.
Undervisningsspråk
Engelska
Litteratur
Kursen bygger på följande öppet tillgängliga material. Vid problem med att få tillgång till materialet, vänligen kontakta kursansvarig.
- The Linux Command Line, A complete Introduction by William Shotts (available at https://www.dbooks.org/the-linux-command-line-1593279523/)
- Python Data Science Handbook by Jake VanderPlas (available at https://jakevdp.github.io/PythonDataScienceHandbook/)
- https://github.com/c3se/gts-course
- An Overview of Artificial Intelligence Ethics, IEEE Transactions on Artificial Intelligence, vol. 4, no. 4, August 2023
- Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016)
- Barker, M., Chue Hong, N.P., Katz, D.S. et al. Introducing the FAIR Principles for research software. Sci Data 9, 622 (2022). https://doi.org/10.1038/s41597-022-01710-x
Examination
Närvaro vid minst 8 av 10 tillfällen samt aktivt deltagande i övningar och diskussioner. Kursens praktiska upplägg kräver fysisk närvaro på campus. Det är därför viktigt att deltagarna är tillgängliga under hela kursperioden.
Betygsskala: U, G