Hoppa direkt till innehållet
printicon

Big data och analys av högdimensionella data

  • Antal högskolepoäng 7,5 hp
  • Nivå Avancerad nivå
  • Starttid Hösttermin 2020

Om kursen

Moment 1 (2 hp): Teori.
I momentet diskuteras vad som karakteriserar big data och högdimensionella data, inkluderande en historisk bakgrund och exempel på tillämpningar. Regressionsanalys inklusive maximum likelihood- och minsta kvadratmetoderna repeteras. Det generella klassificeringsproblemet introduceras. Mål med klassificering och hur prestanda mäts diskuteras. Vidare ingår valideringsmetoder, inklusive korsvalidering och utvärdering med hjälp av oberoende testdata. Teori för, och tillämpningar av logistisk regressionsanalys samt linjär och kvadratisk diskriminantanalys (LDA respektive QDA) tas upp. Variabelselektion för klassificeringsproblem, ridge regression, lasso, och principalkomponentanalys (PCA) behandlas, samt hur dessa metoder kan användas tillsammans med logistisk regression, LDA och QDA. Programspråket R och intressanta programbibliotek introduceras, inkluderande diskussion av ett genomarbetat exempel innehållande variabelselektion, klassificering och evaluering. Vidare ingår metoderna "K-nearest neighbour" (KNN), "support vector machines" (SVM) och "random forest". Det generella klusteranalysproblemet introduceras. Mål med klusteranalys och hur prestanda (robusthet) mäts diskuteras. I samband med detta behandlas hierarkisk klusteranalys, "k-means" och "self-organizing maps" (SOM).
 
Moment 2 (5.5 hp) Datorlaborationer.
I momentet ingår analys av flera datamaterial med hjälp av de i kursen ingående statistiska metoderna. Analyserna utförs i programspråket R. I momentet ingår omfattande skriftliga redogörelser av analyserna och dess resultat.

I en examen får denna kurs ej ingå tillsammans med en annan kurs med likartat innehåll. Vid osäkerhet bör den studerande rådfråga studierektor i matematik och matematisk statistik. Kursen kan ingå i en examen som en kurs i huvudområdet beräkningsteknik

Anmälan och behörighet

Big data och analys av högdimensionella data, 7,5 hp

Visa tillfällen för föregående termin Hösttermin 2020 Det finns inga senare terminer för kursen

Startar

2 november 2020

Slutar

17 januari 2021

Studieort

Umeå

Undervisningsspråk

Engelska

Studieform

Dagtid, 50%

Behörighetskrav

För tillträde till kursen krävs 90 hp inkluderande 12 hp matematisk statistik och 7,5 hp programmeringsmetodik eller motsvarande kunskaper. Engelska A och svenska för grundläggande behörighet för högskolestudier (om kursen ges på svenska).

Urval

Platsgaranti Sökande inom vissa program vid Umeå universitet har platsgaranti till denna kurs. Antalet platser för fristående kurs kan därför bli begränsat.

Anmälningskod

UMU-58216

Anmälan

Du kan inte anmäla dig ännu. Anmälan öppnar 16 mars 2020 klockan 13:00. Sista anmälningsdag är den 15 april 2020.

Studieavgifter

Anmälnings- och studieavgifter krävs för dig som inte har medborgarskap i EU, EES-länderna eller Schweiz. Läs mer på antagning.se

Kontaktformulär

Kontaktformulär

Tänk på att universitetet är en statlig myndighet och att det du skriver här kan bli en allmän handling. Var därför försiktig med att skriva känsliga eller personliga frågor här i kontaktformuläret. Alla uppgifter behandlas enligt dataskyddsförordningen (GDPR)

Kontaktperson för kursen är:
Studievägledare Lars-Daniel Öhman