Multivariat dataanalys 7,5 hp
Om kursen
I kursen ges grundläggande teori och metoder för multivariat dataanalys och en solid grund läggs för att studenten i nästa steg ska lära sig mer avancerade metoder och algoritmer. Utgångspunkten är den multivariata normalfördelningen (MGD) och dess generalisering, den mixade Gaussiska modellen. Maximum likelihood skattning (MLE) och EM-algoritmen diskuteras. Baserat på MGD introduceras statistiska inferensmetoder (Hotellings T-kvadrattest, multivariat variansanalys (MANOVA), klassificeringsmetoder (linjär diskriminantanalys och logistisk regressionsanalys), och klusteranalysmetoder. Vidare introduceras olika egenvärdesuppdelningsbaserade metoder för dimensionalitetsreduktion, såsom principal komponentanalys (PCA), faktoranalys (FA), kanonisk korrelationsanalys (CCA) och partiell minstakvadratanpassning (PLS). Modeller för regressionsanalys med kolinjära förklaringsvariabler som principal component regression (PCR) och PLS-regression ingår också.
Modul 1 (5 hp): Teori och tillämpningar
Modulen omfattar multivariata fördelningar med särskild tonvikt på den multivariata normalfördelningen och dess egenskaper. EM-algoritmen för att hitta maximum likelihoodskattning i multivariata modeller introduceras. Vidare behandlas metoder för slutledning om väntevärdesvektorer och varians- och korrelationsmatriser, tillsammans med metoder för projektioner, klassificering och klusteranalys.
Modul 2 (2,5 hp): Datorlaborationer
Modulen behandlar multivariat dataanalys med lämplig statistisk programvara inklusive skriftlig och muntlig presentation av resultat.