Engelskt namn: Statistics C1
Denna kursplan gäller: 2014-12-08 till 2019-10-27 (nyare version av kursplanen finns)
Kursplan för kurser med start efter 2019-10-28
Kursplan för kurser med start mellan 2014-12-08 och 2019-10-27
Kursplan för kurser med start mellan 2012-01-23 och 2014-12-07
Kurskod: 2ST014
Högskolepoäng: 15
Utbildningsnivå: Grundnivå
Huvudområden och successiv fördjupning:
Statistik: Grundnivå, har minst 60 hp kurs/er på grundnivå som förkunskapskrav
Betygsskala: Väl godkänd, godkänd, underkänd
Ansvarig institution: USBE Statistik
Beslutad av: Statistiska institutionens styrelse, 2008-02-12
Reviderad av: Rektor för Handelshögskolan, 2014-09-25
Kursen består av tre moment:
Moment 1: Statistisk inferensteori (5 hp)
Moment 2: Statistisk analys av stora och komplexa datamängder med R (7 hp)
Moment 3: Inlämningsuppgifter i analys av stora och komplexa datamängder med R (3 hp)
Moment 1
Momentet inleds med en repetition och fördjupning av den sannolikhetsteori från Statistik B som behövs för fördjupad förståelse av den statistiska inferensteorin. Speciellt studeras begreppen tillräcklighet, konsistens samt asymptotiska fördelningar. Därefter sker en breddning samt fördjupning av den statistiska inferensteori som ingår i kursen Statistik B genom att maximum likelihood-skattningar och likelihoodkvottest behandlas mer ingående. Under momentets senare del behandlas resampling-metoder och bayesiansk inferens. Den statistiska inferensteorins användbarhet påvisas löpande under momentet med exempel från olika tillämpningsområden. Programvaran R används för att illustrera delar av innehållet i momentet. Genomgående läggs stor vikt vid både förståelse och tillämpning av viktiga statistiska begrepp och metoder som ingår i momentet.
Moment 2
Momentet behandlar statistiska metoder för att lösa de speciella problem som uppkommer vid analys av stora och komplexa datamängder, med tonvikt på metoder för modellselektering och dimensionsreducering. Dessa metoder ingår i begreppet ”statistical learning”, vars två huvudgrupper kallas ”supervised learning” respektive ”unsupervised learning”. ”Supervised learning” används då man har en responsvariabel som man vill bygga en statistisk modell för med hjälp av prediktorer, medan ”unsupervised learning” används då man vill hitta samband och strukturer i en datamängd där ingen av variablerna är en responsvariabel. I ”supervised learning” ingår regressionsanalysmetoder, i vid bemärkelse, och metoder med syfte att prediktera kvalitativa responsvariabler, s k klassificeringsmetoder. Momentet inleds med en kort repetition av linjär regressionsanalys från kursen Statistik B. Regressionsanalysen fördjupas och generaliseras bl a med metoder för icke-linjär och icke-parametrisk regression. Metoder för klassificering, t ex logistisk regression, diskriminantanalys och beslutsträd behandlas. Genomgående jämförs olika metoder med avseende på användbarhet och effektivitet i olika situationer. Under momentets senare del behandlas principalkomponentanalys och klusteranalys, som är metoder inom det som kallas ”unsupervised learning”. Programvaran R används genomgående.
Moment 3
Momentet består av obligatoriska inlämningsuppgifter och löper delvis parallellt med moment 2. Uppgifterna behandlar metoder som tas upp under moment 2. Programvaran R ska användas vid lösning av uppgifterna. Syftet är att praktiskt tillämpa den kunskap om ”statistical learning” som inhämtats under moment 2.
Efter att ha genomgått kursen förväntas studenten kunna:
• förklara innebörden i de viktigaste begreppen och resultaten inom såväl frekventistisk som bayesiansk inferensteori,
• tillämpa den frekventistiska inferensteorin som tas upp i kursen,
• tillämpa de resampling-metoder som tas upp i kursen,
• tillämpa de begrepp inom bayesiansk inferensteori som tas upp i kursen,
• analysera data som kännetecknas av slumpmässiga variationer med hjälp av såväl frekventistisk som bayesiansk inferensteori,
• förklara innebörden i de viktigaste begreppen och resultaten inom ”statistical learning”,
• använda programvaran R för analys av stora och komplexa datamängder,
• för ett givet problem inom ”supervised learning” välja lämplig metod, välja lämpliga prediktorer, samt tolka och utvärdera resultaten,
• tillämpa metoderna som tas upp i kursen inom ”unsupervised learning”,
• grafiskt visualisera stora och komplexa datamängder samt skriftligt och muntligt presentera resultat av dataanalyser.
Univ: Statistik B, 60 hp, eller motsvarande kunskaper.
Undervisningen består av föreläsningar, lektioner, datorlektioner, seminarier och handledning. Obligatoriska seminarier/inlämningsuppgifter förekommer.
Kunskapskontrollen sker genom skriftliga individuella salstentamina av moment 1 och 2 samt genom skriftliga individuella inlämningsuppgifter, s k hemtentamen, av moment 3. Muntlig tentamen kan ersätta den skriftliga salstentamen i de fall då högst fyra studenter är anmälda till tentamen. På skriftliga (alt. muntliga) tentamina samt hemtentamen ges betygen Underkänd (U), Godkänd (G), eller Väl Godkänd (VG). På seminariedeltagande ges endast betygen Godkänd (G) eller Underkänd (U). För de obligatoriska uppgifterna fastställs vissa datum då redogörelse ska inlämnas och/eller muntlig presentation ges. Eventuella kompletteringar ska ske senast två veckor efter momentets slutdatum.
För att bli godkänd på hela kursen krävs att samtliga tentamina och obligatoriska uppgifter är godkända. Betyget utgör en sammanfattande bedömning av resultaten vid examinationens olika delar och sätts först när alla kursmoment är godkända.
Studerande som godkänts i prov får inte undergå förnyat prov för att uppnå ett högre betyg. För studerande som ej blivit godkänd erbjuds ytterligare provtillfällen enligt ett fastställt schema.
Efter två underkända prov på ett moment har studenten rätt att begära byte av examinator. Skriftlig begäran lämnas till studierektor senast två veckor före nästa examinationstillfälle.
Examination baserad på samma kursplan som vid ordinarie examinationstillfälle garanteras två år efter studentens förstagångsregistrering på kursen.
Tillgodoräknande
Tillgodoräknande sker enligt Umeå universitets tillgodoräknandeordning.
Mathematical Statistics With Applications
Wackerly Dennis D., Mendenhall William, Scheaffer Richard L.
senaste :
Obligatorisk
Tillkommer material som tillhandahålls vid institutionen.
An Introduction to Statistical Learning : with Applications in R
James Gareth., Witten Daniela., Hastie Trevor., Tibshirani Robert.
New York, NY : Springer New York : 2013. : xiv, 426 p. 150 ill., 146 ill. in color. :
ISBN: 9781461471370
Obligatorisk
Se Umeå UB:s söktjänst
An Introduction to Statistical Learning : with Applications in R
James Gareth., Witten Daniela., Hastie Trevor., Tibshirani Robert.
New York, NY : Springer New York : 2013. : xiv, 426 p. 150 ill., 146 ill. in color. :
ISBN: 9781461471370
Obligatorisk
Se Umeå UB:s söktjänst