NYHET
Inom kemin idag generas det stora datamängder. Dessa kan till exempel komma från beskrivningen av strukturen hos en serie molekyler eller från beskrivningen av en industriell process. Detta resulterar i stora och komplexa datatabeller som måste analyseras.
Vanligt förekommande är att dessa beskrivningar av t ex en serie molekyler eller en process, vill relateras till en så kallad respons. För en serie av molekyler kan responsen vara dess biologiska aktivitet och för processer kvaliteten på slutprodukten.
För att analysera datatabellerna och finna ett samband mellan dessa och responsen finns det ett antal dataanalytiska verktyg att tillgå. En av dessa är PCA, som kan analysera stora datatabeller. Med PCA är det möjligt att finna grupperingar, klasser för de olika molekylerna och vilka strukturella egenskaper som orsakar dessa. I avhandlingen presenteras en modifierad PCA-algorithm som gör det möjligt att analysera komplexa datatabeller och ändå kunna få ett överskådligt resultat.
För att hitta det matematiska sambandet mellan en datatabell och en respons, används ofta en teknik som kallas PLS. Med PLS är det möjligt att finna t ex vilka strukturella egenskaper för en molekyl som orsakar en ökad biologisk aktivitet. I avhandlingen presenteras två olika förbättrade versioner av PLS. En icke-linjär PLS för samband där inte en linjär funktion är tillräcklig och en seriell PLS-extension för problem där det är fler än en datatabell som ska relateras till en respons.
Lördagen den 28 februari försvarar Anders Berglund, Kemometrigruppen, Organisk kemi, Kemiska institutionen, Umeå universitet, sin doktorsavhandling med titeln Några extensioner av PCA och PLS. Disputationen äger rum kl 10.00 i Naturvetarhuset, sal N320.
Fakultetsopponent: Professor Garland Marshall, Center for Molecular Design, Washington University, St. Louis, USA.