Innovativa statistik och maskininlärningsmetoder för jämförelser av prediktion och utfall i registerdata
Forskningsprojekt
Statistiska utmaningar inom olika tillämpningsområden har ofta stora likheter. Statistisk metodutveckling bör därför inte begränsas till endast ett tillämpningsområde. I detta projekt utvecklar vi nya statistiska metoder och tillämpar dem på olika registerdata som delar liknande egenskaper.
Projektet syftar till att utveckla nya statistiska metoder och tillämpa dem på registerdata, som delar liknande egenskaper, från två områden med stor samhällspåverkan: utbildning och hälsa. Förutom att förutsäga utfall är ett vanligt mål inom utbildning och hälsa att förstå de underliggande mekanismerna för att utvärdera och förbättra interventioner.
Projektets övergripande syftet är att utveckla, utvärdera och implementera innovativa statistiska metoder, inklusive moderna maskininlärningsmetoder, för att dra slutsatser baserat på registerdata. Metoderna kommer att utvärderas med data från utbildnings- och hälsoregister men är inte begränsade till dessa utan generiska. Projektet genomförs i nära samarbete med forskare inom statistik, utbildningsvetenskap och medicinsk vetenskap. Forskningens syfte är strukturerad i tre teman:
1) Utveckla innovativa statistiska metoder som kombinerar information från olika mätmetoder (frågor, mätskalor och instrument) samt förbättrar normering (standardisering) av resultat från dessa. En utmaning är att olika frågor, skalor och instrument kan ha använts vid olika tidpunkter. Frågorna kan variera i svårighetsgrad, innehåll och sammanhang. När man jämför individer är det vanligt att använda normerad poäng som baseras på totalsumman från olika delskalor. Vi ämnar istället använda all information från de ingående delskalorna för att få säkrare skattningar av individens sammanlagda resultat.
2) Utveckla och anpassa moderna maskininlärningsmetoder för att undersöka ojämlikheter i resultat och prestation med hjälp av registerdata. Genom att kombinera individers bakgrundsinformation med resultat från frågor, skalor och instrument, kan man få effektivare metoder samt upptäcka eventuella ojämlikheter, vilket i sin tur kan leda till strukturförändringar. 3) Implementera de föreslagna metoderna med olika registerdata och utveckla lätt tillgänglig programvara för att sprida användningen av de nya metoderna till forskare och utövare.
Projektet förväntas ha stor inverkan på registerbaserad forskning genom att bidra till en förbättring av nuvarande praxis. Resultaten är viktiga för beslutsfattare, forskare, och de individer som deltar med information i dessa register.