Huvudområden och successiv fördjupning:
Statistik: Grundnivå, har minst 60 hp kurs/er på grundnivå som förkunskapskrav
Betygsskala: Väl godkänd, godkänd, underkänd
Ansvarig institution: USBE Statistik
Beslutad av: Rektor för Handelshögskolan, 2020-09-10
Reviderad av: Rektor för Handelshögskolan, 2025-05-21
Innehåll
Kursen består av två moment:
Moment 1: Metoder för data science (5 hp) Moment 2: Tillämpningar inom data science (5 hp)
Moment 1 Momentet behandlar statistiska metoder för att lösa de speciella problem som uppkommer inom data science, med tonvikt på metoder för modellselektering vid och dimensionsreducering av stora och komplexa datamängder.
Momentet behandlar "statistical learning", vars två huvudgrupper kallas "supervised learning" respektive "unsupervised learning". "Supervised learning" används då man har en responsvariabel som man vill bygga en statistisk modell för med hjälp av prediktorer, medan "unsupervised learning" används då man vill hitta samband och strukturer i en datamängd där ingen av variablerna är en responsvariabel. I "supervised learning" ingår regressionsanalysmetoder, i vid bemärkelse, och metoder med syfte att prediktera kvalitativa responsvariabler, s k klassificeringsmetoder. Momentet inleds med en kort repetition av linjär regressionsanalys från kursen Statistik B: Programmering och modellering. Regressionsanalysen fördjupas och generaliseras bl a med metoder för icke-linjär och icke-parametrisk regression. Metoder för klassificering, t ex logistisk regression, diskriminantanalys och beslutsträd behandlas. Genomgående jämförs olika metoder med avseende på användbarhet och effektivitet i olika situationer. Under momentets senare del behandlas principalkomponentanalys och klusteranalys, som är metoder inom det som kallas "unsupervised learning". Programvaran R används genomgående.
Moment 2 Momentet består av obligatoriska inlämningsuppgifter och löper delvis parallellt med moment 1. Uppgifterna behandlar metoder som tas upp under moment 1. Syftet är att praktiskt tillämpa den kunskap om "statistical learning" som inhämtats under moment 1.
Förväntade studieresultat
Kunskap och förståelse Studenten ska kunna 1. förklara innebörden i de viktigaste begreppen och resultaten inom "statistical learning".
Färdighet och förmåga Studenten ska kunna 2. använda programvaran R för analys av stora och komplexa datamängder. 3. välja passande metod och lämpliga prediktorer samt tolka och utvärdera resultaten för ett givet problem inom "supervised learning". 4. tillämpa metoderna som tas upp i kursen inom "unsupervised learning". 5. presentera resultat av dataanalyser av stora och komplexa datamängder på ett sådant sätt att dataanalysen är reproducerbar.
Behörighetskrav
Univ: Statistik C: Inferensteori, 5 hp, eller motsvarande kunskaper.
Undervisningens upplägg
Undervisningen består av föreläsningar, lektioner och handledning. Dessa inslag kompletteras med videoföreläsningar och s.k. omvänt klassrum-upplägg (flipped classroom) på delar av kursen.
Undervisningen i vissa kursmoment/delar av moment kan komma att ges på engelska.
Examination
Kunskapskontrollen sker genom skriftlig individuell salstentamen av moment 1 samt genom skriftliga individuella inlämningsuppgifter av moment 2. På båda momenten ges omdömen Underkänd (U), Godkänd (G) eller Väl Godkänd (VG).
För de obligatoriska inlämningsuppgifterna fastställs vissa datum då redogörelse ska ges. Eventuella kompletteringar ska ske senast två veckor efter momentets slutdatum.
För att bli godkänd på hela kursen krävs att tentamen och samtliga obligatoriska uppgifter är godkända. Betyget utgör en sammanfattande bedömning av resultaten vid examinationens olika delar och sätts först när alla kursmoment är godkända. För betyget VG krävs VG på båda momenten.
Studerande som godkänts på ett prov får inte undergå förnyat prov för att uppnå ett högre betyg. För studerande som ej blivit godkänd erbjuds ytterligare provtillfällen enligt ett fastställt schema.
En student som utan godkänt resultat har genomgått ordinarie prov samt ett omprov för en kurs eller en del av en kurs, har vid nästa omprovstillfälle rätt att få en annan examinator eller rättande lärare utsedd, om inte särskilda skäl talar emot det. Student ska vända sig till studierektor med en sådan begäran senast två veckor innan nästa provtillfälle.
Examination baserad på samma kursplan som vid ordinarie examinationstillfälle garanteras två år efter studentens förstagångsregistrering på kursen.
Anpassningar Examinator kan besluta om avsteg från kursplanens examinationsform. Individuell anpassning av examinationsformen ska övervägas utifrån studentens behov. Examinationsformen anpassas inom ramen för kursplanens förväntade studieresultat. Student som har behov av en anpassad examination, och som har erhållit ett beslut om rätt till stöd från samordnare för studenter med funktionsnedsättning vid Studentcentrum, ska inom föreskriven tid begära anpassning hos kursansvarig institution. Examinator beslutar om anpassad examination som sedan meddelas studenten.
Tillgodoräknande Tillgodoräknande sker enligt Umeå universitets tillgodoräknandeordning.
Övriga föreskrifter
Undervisningen i vissa kursmoment/delar av moment kan komma att ges på engelska.
Litteratur
Giltig från:
2025 vecka 36
An introduction to statistical learning : with applications in R James Gareth, Witten Daniela, Hastie Trevor, Tibshirani Robert Second edition. : New York : Springer : [2021] : xv, 607 sidor : ISBN: 9781071614174 Obligatorisk Se Umeå UB:s söktjänst Läsanvisning: Boken finns som gratis elektronisk resurs på https://www.statlearning.com/