Big data och analys av högdimensionella data, 7,5 hp
Kursen är nedlagd från och med 2025-06-13
Innehåll
Denna kurs ger både vad gäller djup och bredd, omfattande kunskap i "data science" och maskininlärning. I kursen diskuteras både traditionella och toppmoderna metoder och algoritmer inom områdena. De relaterade grundläggande teorierna behandlas också. Efter godkänd kurs förväntas studenterna ha stark förmåga att lösa problem med hjälp av data. Dessutom förväntas de ha en stark självstudieförmåga för att förstå och lära sig nyutvecklade metoder och algoritmer.
Modul 1 (3 hp): Teori.
Kursen omfattar tre familjer av tillvägagångssätt för dimensionalitetsreduktion: spektralbaserad inlärning (multidimensionell skalning, isomap, kernel PCA, etc.), mångfaldig inlärning (lokalt linjär inbäddning, Hessian eigen-mapping, t-fördelad stokastisk granninbäddning, etc.), och metoder baserade på djupa neurala nätverk (autoencoders, variational autoencoder, etc.). Som specialfall av dimensionalitetsreduktion diskuteras också olika metoder för val av egenskaper, såsom ridge-regression, LASSO och feature importance. Övervakade inlärningsmetoder inklusive de kärnbaserade metoderna (Kernel ridge regression, support vector machine, etc.), ensemble-metoder (random forest och adaboost), neurala nätverk och olika djupinlärningsmetoder och arkitekturer diskuteras. Dessutom ingår oövervakade inlärningsmetoder inklusive olika klustringsanalysalgoritmer, såsom densitetsbaserade metoder och spektral klusteranalys. Djupinlärningsbaserade oövervakade inlärningsmetoder, såsom generativa kontradiktoriska nätverk och dess variationer innefattas också. Slutligen diskuteras grundläggande matematiska teorier för kärnmetoder, ensemblemetoder, ansatser med straff, grunda nätverk, algoritmer för sluttande gradient, universella estimatorer och fundamentala inlärningssatsen etc.
Modul 2 (4.5 hp) Datorlaborationer.
I modulen ingår analys av flera datamaterial med hjälp av de i kursen ingående statistiska metoderna. Analyserna utförs i något av programspråken R eller Python. I modulen ingår omfattande skriftliga redogörelser för analyserna och deras resultat.
Förväntade studieresultat
För godkänd kurs ska studenten kunna
Kunskap och förståelse
- ingående beskriva grundläggande idéer bakom, och utformande av olika algoritmer för problem rörande dimensionsreduktion samt övervakad och oövervakad inlärning
- beskriva och härleda de teoretiska resultaten
Färdighet och förmåga
- tillämpa de grundläggande idéerna bakom, och de vanligaste teknikerna för att bygga statistiska modeller och maskininlärningsmodeller
- implementera metoder och algoritmer i programspråk som R eller Python
- identifiera lämpliga analysmetoder, lämpliga variabelselektionsmetoder och lämpliga metoder för dimensionsreduktion, för givna klassificerings- och klusteranalysproblem
- tillämpa valideringsmetoder för att bland lämpliga analys-, variabelselektions- och dimensionsreduktionsmetoder välja den mest lämpliga för specifika klassificerings- och klusteranalysproblem
- presentera analysresultat i skriftlig form
Värderingsförmåga och förhållningssätt
- kritiskt värdera klassificeringsmetoder och klusteranalysmetoder ur ett vetenskapligt perspektiv
Behörighetskrav
För tillträde till kursen krävs 90 hp inkluderande 7,5 hp programmeringsmetodik och 12 hp matematisk statistik varav minst 7,5 hp i multivariat dataanalys på avancerad nivå eller motsvarande kunskaper. Engelska A/5 och svenska för grundläggande behörighet för högskolestudier (om kursen ges på svenska).
Undervisningens upplägg
Undervisningen på modul 1 bedrivs i form av föreläsningar och lektioner. Undervisningen på modul 2 bedrivs i form av handledning av laborationer.
Examination
Examinationen sker i form av skriftliga laborationsrapporter och skriftlig tentamen. De skriftliga laborationsrapporterna bedöms som Underkända (U) eller Godkända (G) och poängsätts. På modul 1 och modul 2 ges något av betygen Underkänd (U) eller Godkänd (G). För godkänt betyg på modul 2 krävs att samtliga skriftliga laborationsrapporter är godkända. På hel kurs sätts något av betygen Underkänd (U), Godkänd (3), Icke utan beröm godkänd (4) eller Med beröm godkänd (5). För att bli godkänd på hela kursen krävs att båda modulerna är godkända. Betyget baseras på den totala poängsumman på laborationsrapporter och tentamen, där laborationsrapporterna står för 2/3 och den skriftliga tentamen för 1/3 av den totala poängsumman.
Den som erhållit godkänt betyg på kursen kan ej examineras för högre betyg. För studerande som inte blivit godkända vid ordinarie provtillfälle anordnas ytterligare provtillfälle. En student som utan godkänt resultat har genomgått två prov för en kurs eller en del av en kurs, har rätt att få en annan examinator utsedd, om inte särskilda skäl talar emot det (HF 6 kap. 22 §). Begäran om ny examinator ställs till prefekten för institutionen för matematik och matematisk statistik. Examination baserad på denna kursplan garanteras under två år efter studentens förstagångsregistrering på kursen.
Tillgodoräknande
Student har rätt att få prövat om tidigare utbildning eller motsvarande kunskaper och färdigheter förvärvade i yrkesverksamhet kan tillgodoräknas för motsvarande utbildning vid Umeå universitet. Ansökan om tillgodoräknande skickas in till Studentcentrum/Examina. Mer information om tillgodoräknande finns på Umeå universitets studentwebb, www.student.umu.se, och i högskoleförordningen (6 kap). Ett avslag på ansökan om tillgodoräknande kan överklagas (Högskoleförordningen 12 kap) till Överklagandenämnden för högskolan. Detta gäller såväl om hela som delar av ansökan om tillgodoräknande avslås.
Övriga föreskrifter
I en examen får denna kurs ej ingå tillsammans med en annan kurs med likartat innehåll. Vid osäkerhet bör den studerande rådfråga studierektorn i matematik och matematisk statistik. Kursen kan ingå i en examen som en kurs i huvudområdet beräkningsteknik.
Litteratur
Arbetsblad i naturkunskap.
: 2 Växter och djur i Sverige
Falk Karl, Nisses-Gagnér Erik, Sjöholm L. Gottfrid
Gävle :
Skrivrit :
1967 :
32 bl. :
Obligatorisk
De colonia Vermelandia dissertatio. Quam consensu ampl. fac. philos. Upsal. exhibent mag. Laurentius Petr. Gagner a sacris et Johannes Magnus Malmstedt stip. Stjerncreutz. Vermelandi. In audit. Gustav. die VIII Maj. MDCCCXIX. H. A. M. S
Gagner Lars Peter, Gagner Lars Peter
Upsaliæ, Excudebant Reg. Acad. typographi :
1819 :
[4], 12 :
Obligatorisk