Hoppa direkt till innehållet
printicon
Huvudmenyn dold.

AI för dokumentgenerering

Forskningsprojekt finansierat av Trafikverket, Umeå universitet och Sweco.

Vi har gjort en chat-robot till vilken man kan ställa olika typer av frågor på dokument och sen få svar snabbt med hjälp av AI-språkteknik. Tekniken testas på Norrbottniabanan i samverkan med Trafikverket.

Projektansvarig

Kalle Prorok
Universitetsadjunkt
E-post
E-post
Telefon
090-786 50 18

Projektöversikt

Projektperiod:

2021-03-01 2021-11-30

Medverkande institutioner och enheter vid Umeå universitet

Institutionen för datavetenskap, Institutionen för tillämpad fysik och elektronik

Externa finansiärer

Trafikverket

Projektbeskrivning

Få svar på allt du undrat över! Vi har gjort en chat-robot där man kan ställa olika typer av frågor på dokument och sen få svar rätt snabbt med hjälp av AI-språkteknik. Det kan handla om:

- Frågor i form av fria meningar "Vad kostar det att bygga Norrbottniabanan?" eller "Vad är vinsterna med den?"

- Få reda på inblandade orter, personer, tider, mått eller organisationer

och/eller

- Få en kortare sammanfattning av det viktigaste i en lång text med speciellt urvalda meningar.

Det som är unikt är att vi dels inte matat in någon mer information än rådokumenten (i pdf, hämtade från webbsidor) som datorn analyserar på egen hand och dels att svarstiderna bara är crka 20 sekunder för 300 sidor tack vare smart utnyttjande av beräkningsgrafikkort av svåråtkomlig nyare modell, en vanlig snabb dator hade behövt tänka typ en timme för att tröska igenom dessa sidor och molntjänster/superdatorer uppstartstider på flera minuter eller ibland veckor.

Tekniken kallas Natural Language Processing, NLP, och tack vare insatser från Kungliga Biblioteket (KB) finns det nu även möjligheter att hantera dokument på Svenska. AI-modellen (BERT) är ursprungligen från Google och programmeringsbiblioteket PyTorch från Facebooks AI lab.

Vi har gjort en prototyp med en allmänt åtkomlig server som har stått till tjänst under några veckor för tester av frågemekanismerna och i den har vi lagt in dokument om Norrbottniabanan (typiskt miljökonsekvensbeskrivningar), Ostlänken samt några äldre böcker (Röda rummet och Nils Holgerssons underbara resa genom Sverige).

Testa!

Här kan du testköra chat-boten 

Bakgrundsinformation