Hoppa direkt till innehållet

Information till studenter och medarbetare med anledning av covid-19 (Uppdaterad: 15 april 2021)

printicon
Publicerad: 02 nov, 2012

3,5 miljoner till ung forskare

NYHET Vetenskapsrådet ger 3,5 miljoner i anslag till Johanna Björklund som ung forskare vid datavetenskap, Umeå universitet.

Text: Mikael Hansson

Johanna Björklund har tilldelats ett anslag om 3 520 000 kronor som Ung Forskare av Vetenskapsrådet inom projektet Syntaktiska metoder för textklassificering.

Inom området Språkteknologi utforskar vetenskapare teorier och metoder för att med datorns hjälp bearbeta språklig information. En central uppgift är textklassificering. På en abstrakt nivå går det ut på att sortera in tidigare osedda dokument i olika kategorier. I praktiken kan det handla om att avgöra vem som har författat en novell, om ett mail ska betraktas som spam eller inte, om en hemsida är skriven på engelska eller svenska, om en produktrecension är positiv, negativ eller neutral, eller om en uppsats är resultatet av plagiat.

I projektet Syntaktiska metoder för textklassificering vill Johanna Björklund tillsammans med sina forskarkollegor göra det lättare att använda syntaktiska stildrag för textklassificering. Målet är att ta fram metoder som berättar vilka syntaktiska mönster som är nyttiga för ett visst klassificeringsproblem. Forskarna vill även titta på hur man kan få en liten mängd träningsdata att räcka så långt som möjligt, och undersöka hur stor betydelse valet av syntaktisk teori har för hur väl ett klassificeringssystem presterar.

Ett lyckat projekt skulle innebära att man bättre förstår vilken syntaktisk information som är användbar vid olika klassificeringsproblem, och hur dessa ska kunna användas för att få så bra klassificeringssystem som möjligt. I praktiken kan det exempelvis ge mer information om upphovsmannen bakom ett antikt manuskript, eller harmonisera stilen i en artikel skriven av en grupp författare.