Hoppa direkt till innehållet
printicon
Huvudmenyn dold.
Kursplan:

Statistik C1, 15 hp

Engelskt namn: Statistics C1

Denna kursplan gäller: 2019-10-28 och tillsvidare

Kurskod: 2ST014

Högskolepoäng: 15

Utbildningsnivå: Grundnivå

Huvudområden och successiv fördjupning: Statistik: Grundnivå, har minst 60 hp kurs/er på grundnivå som förkunskapskrav

Betygsskala: För denna kurs ges betygen VG Väl godkänd, G Godkänd, U Underkänd

Ansvarig institution: USBE Statistik

Beslutad av: Statistiska institutionens styrelse, 2008-02-12

Reviderad av: Rektor för Handelshögskolan, 2019-10-24

Innehåll

Kursen består av tre moment:
Moment 1: Statistisk inferensteori (5 hp)
Moment 2: Statistisk analys av stora och komplexa datamängder med R (7 hp)
Moment 3: Inlämningsuppgifter i analys av stora och komplexa datamängder med R (3 hp)


Moment 1

Momentet inleds med en repetition och fördjupning av den sannolikhetsteori från Statistik B som behövs för fördjupad förståelse av den statistiska inferensteorin. Speciellt studeras begreppen tillräcklighet, konsistens samt asymptotiska fördelningar. Därefter sker en breddning samt fördjupning av den statistiska inferensteori som ingår i kursen Statistik B genom att maximum likelihood-skattningar och likelihoodkvottest behandlas mer ingående. Under momentets senare del behandlas resampling-metoder och bayesiansk inferens. Den statistiska inferensteorins användbarhet påvisas löpande under momentet med exempel från olika tillämpningsområden. Programvaran R används för att illustrera delar av innehållet i momentet. Genomgående läggs stor vikt vid både förståelse och tillämpning av viktiga statistiska begrepp och metoder som ingår i momentet.


Moment 2

Momentet behandlar statistiska metoder för att lösa de speciella problem som uppkommer vid analys av stora och komplexa datamängder, med tonvikt på metoder för modellselektering och dimensionsreducering. Dessa metoder ingår i begreppet "statistical learning", vars två huvudgrupper kallas "supervised learning" respektive "unsupervised learning". "Supervised learning" används då man har en responsvariabel som man vill bygga en statistisk modell för med hjälp av prediktorer, medan "unsupervised learning" används då man vill hitta samband och strukturer i en datamängd där ingen av variablerna är en responsvariabel.  I "supervised learning" ingår regressionsanalysmetoder, i vid bemärkelse, och metoder med syfte att prediktera kvalitativa responsvariabler, s k klassificeringsmetoder. Momentet inleds med en kort repetition av linjär regressionsanalys från kursen Statistik B. Regressionsanalysen fördjupas och generaliseras bl a med metoder för icke-linjär och icke-parametrisk regression. Metoder för klassificering, t ex logistisk regression, diskriminantanalys och beslutsträd behandlas. Genomgående jämförs olika metoder med avseende på användbarhet och effektivitet i olika situationer. Under momentets senare del behandlas principalkomponentanalys och klusteranalys, som är metoder inom det som kallas "unsupervised learning". Programvaran R används genomgående.


Moment 3

Momentet består av obligatoriska inlämningsuppgifter och löper delvis parallellt med moment 2. Uppgifterna behandlar metoder som tas upp under moment 2. Programvaran R ska användas vid lösning av uppgifterna. Syftet är att praktiskt tillämpa den kunskap om "statistical learning" som inhämtats under moment 2.

Förväntade studieresultat

Efter att ha genomgått kursen förväntas studenten kunna:
  • förklara innebörden i de viktigaste begreppen och resultaten inom såväl frekventistisk som bayesiansk inferensteori,
  • tillämpa den frekventistiska inferensteorin som tas upp i kursen,
  • tillämpa de resampling-metoder som tas upp i kursen,
  • tillämpa de begrepp inom bayesiansk inferensteori som tas upp i kursen,
  • analysera data som kännetecknas av slumpmässiga variationer med hjälp av såväl frekventistisk som bayesiansk inferensteori,
  • förklara innebörden i de viktigaste begreppen och resultaten inom "statistical learning",
  • använda programvaran R för analys av stora och komplexa datamängder,
  • för ett givet problem inom "supervised learning" välja lämplig metod, välja lämpliga prediktorer, samt tolka och utvärdera resultaten,
  • tillämpa metoderna som tas upp i kursen inom "unsupervised learning",
  • presentera resultat av dataanalyser av stora och komplexa datamängder.

Behörighetskrav

Univ: Statistik B, 60 hp, eller motsvarande kunskaper.

Undervisningens upplägg

Undervisningen består av föreläsningar, lektioner, datorlektioner, seminarier och handledning. Dessa inslag kompletteras med videoföreläsningar och s.k. omvänt klassrum-upplägg (flipped classroom) på delar av kursen. Obligatoriska seminarier/inlämningsuppgifter förekommer. Undervisningen i vissa kursmoment/delar av moment kan komma att ges på engelska.

Examination

Kunskapskontrollen sker genom skriftliga individuella salstentamina av moment 1 och 2 samt genom skriftliga individuella inlämningsuppgifter av moment 3. På alla momenten ges betygen Underkänd (U), Godkänd (G), eller Väl Godkänd (VG). För de obligatoriska uppgifterna fastställs vissa datum då redogörelse ska ges.

För att bli godkänd på hela kursen krävs att samtliga tentamina och obligatoriska uppgifter är godkända. Betyget utgör en sammanfattande bedömning av resultaten vid examinationens olika delar och sätts först när alla kursmoment är godkända. För betyget VG krävs VG på minst två av momenten.

För studenter som inte godkänns vid det ordinarie provtillfället anordnas ett omprov inom två månader. Därutöver anordnas ett extra tentamenstillfälle varje läsår veckan före höstterminstart. Därpå följande tentamensmöjligheter ges i samband med att momentet anordnas nästa gång. Eventuella kompletteringar på de individuella inlämningsuppgifterna ska ske senast samma termin. De individuella inlämningsuppgifter som ej görs under avsatt tid får fullgöras nästa gång kursen ges.

Avsteg från kursplanens examinationsform kan göras för en student som har beslut om pedagogiskt stöd på grund av funktionsnedsättning. Individuell anpassning av examinationsformen ska övervägas utifrån studentens behov. Examinationsformen anpassas inom ramen för kursplanens förväntade studieresultat. Efter begäran av studenten ska kursansvarig lärare, i samråd med examinator, skyndsamt besluta om anpassad examinationsform. Beslutet ska sedan meddelas studenten.

När en student har underkänts på en examination vid två tillfällen har hen rätt att begära att annan examinator utses att bestämma betyg. Skriftlig begäran lämnas till studierektor senast två veckor före nästa examinationstillfälle.

Studenter garanteras minst tre provtillfällen (inklusive ordinarie provtillfälle) enligt tidigare kursplan under en tid av maximalt två år från det att tidigare kursplan upphört att gälla eller kursen slutat erbjudas.

Övriga föreskrifter

Undervisningen i vissa kursmoment/delar av moment kan komma att ges på engelska.

Litteratur

Giltig från: 2019 vecka 44

Moment 1

Mathematical Statistics With Applications
Wackerly Dennis D., Mendenhall William, Scheaffer Richard L.
senaste :
Obligatorisk

Tillkommer material som tillhandahålls vid institutionen.

Moment 2

An Introduction to Statistical Learning : with Applications in R
James Gareth., Witten Daniela., Hastie Trevor., Tibshirani Robert.
New York, NY : Springer New York : 2013. : xiv, 426 p. 150 ill., 146 ill. in color. :
ISBN: 9781461471370
Obligatorisk
Se bibliotekskatalogen Album

Moment 3

An Introduction to Statistical Learning : with Applications in R
James Gareth., Witten Daniela., Hastie Trevor., Tibshirani Robert.
New York, NY : Springer New York : 2013. : xiv, 426 p. 150 ill., 146 ill. in color. :
ISBN: 9781461471370
Obligatorisk
Se bibliotekskatalogen Album