Hoppa direkt till innehållet

Information till studenter och medarbetare med anledning av covid-19 (Uppdaterad: 15 april 2021)

printicon
Publicerad: 19 jan, 2021

Att möjliggöra forskning – forskningsdata för framtiden

REPORTAGE Följ med i ett samtal mellan forskaren Per Ambrosiani från Institutionen för språkstudier och Sanna Isabel Ulfsparre, bibliotekarie vid Umeå universitetsbibliotek. Samtalet kom att handla om vad som egentligen räknas som forskningsdata. Hur tillgängliggör man sitt material och hur känns det att göra det synligt för omvärlden?

Text: Susanne Sjöberg, Sanna Isabel Ulfsparre

Per Ambrosiani, professor i ryska, har sedan 2014 arbetat tillsammans med framför allt docent Elisabeth Löfstrand vid Stockholms universitet för att tillgängliggöra ryska 1600-talsdokument från det så kallade Smolenskarkivet. Arbetet har utförts med finansiering från Riksbankens jubileumsfond med målet att tillgängliggöra materialet genom att bygga upp en digital katalog på Riksarkivet i Stockholm. Dokumenten har en intressant historia, då de tillkom under belägringen och intagandet av staden Smolensk under perioden 1609–1611 för att sedan först tas som krigsbyte till Polen, för att slutligen återigen flyttas - denna gång som krigsbyte till Sverige i mitten av 1600-talet. De är även av språkhistoriskt intresse, då de cirka 1 000 bladen fördelade på 75 rullar är skrivna med en tidstypisk rysk handstil, som kallas skoropis.

Ett sådant sammansatt material är intressant som forskningsdata inom flera olika ämnesområden och en betydande andel av forskarna som kan ha användning av det finns utanför Sveriges gränser. Per Ambrosiani tog kontakt med bibliotekets avdelning för publicering och forskarstöd, för att på bästa sätt kunna göra databasen tillgänglig genom så många kanaler som möjligt. I samband med Pers kontakt med biblioteket passade vi på att prata om att hitta och lyfta fram forskningsmaterial, och på ett sätt som i så hög grad som möjligt kommer framtida forskning till nytta.

− Det har från början varit målet med projektet, att det skulle bli en katalog tillgänglig på Riksarkivet, berättar Per Ambrosiani och fortsätter:

− Förhoppningen är att det kan användas av flera discipliner och resultera i framtida forskningsprojekt. Historiker och filologer kan ha intresse av materialet till exempel, men på olika sätt.

Förhoppningen är att det kan användas av flera discipliner och resultera i framtida forskningsprojekt

Många dokument har transkriberats av deltagarna i projektet för att de ska bli begripliga även för de som inte själva kan läsa skoropis.

− Den som inte kan läsa texten själv får helt enkelt tro på oss och lita på att vi har transkriberat korrekt, säger Per Ambrosiani.

− Men man ska vara medveten om att en sådan transkribering av den här typen av text kan vara svår att få exakt. Texterna innehåller otydligheter och är skrivna utifrån språkliga konventioner som har förändrats över tid. Därför har vi även gjort texterna tillgängliga som digitalt bildmaterial, så att den som själv kan läsa skoropis kan se ursprungsmaterialet och göra en egen bedömning.

På frågan om hur det känns när ens data blir öppen och tillgänglig för andra utanför projektet svarar han:

− Det känns bra, samtidigt som det förstås innebär en sårbarhet inför att man kan råka ”avslöja sin inkompetens”. Men i den akademiska världen är man van vid detta, det känns så varje gång man publicerar något och det får man ta.

Vad är forskningsdata?

Det kan kännas vanskligt att definiera vad som egentligen räknas som forskningsdata när man ställs inför uppgiften att organisera ett komplext material med bred potential. Att organiseringen och beskrivningen av materialet håller hög kvalité är centralt för att materialet ska vara möjligt att hitta, förstå och, om möjligt, återanvändas av andra.

− Råmaterial, bilder, transkriberingar, processbeskrivningar, metadata – allt som går att beforska räknas som potentiell forskningsdata när man arbetar med att beskriva och tillgängliggöra sådana resurser, säger Sanna Isabel Ulfsparre.

− Då ligger fokus på att andra ska kunna hitta materialet, oavsett om de själva forskar inom samma ämnesområde som den som gjorde materialet tillgängligt från början, eller inom ett helt annat ämnesområde.

Det viktiga är i första hand att forskare får tillgång till en uttömmande beskrivning av materialet och en möjlighet att orientera sig kring vilken forskningsdata som finns. Ibland kanske det räcker, ibland kanske man behöver åtkomst till råmaterialet. Då behövs även sätt att komma åt resurserna vara beskrivna. Av olika anledningar är det inte allt material som går att göra tillgängligt i lika hög utsträckning som Smolenskarkivet, ibland på grund av begränsningar i materialets format, ibland på grund av etiska hänsynstaganden – till exempel när där finns känsliga personuppgifter. Utmaningen är att organisera data på ett sätt som är strukturerat, sökbart, tydligt och beskriver alla aspekter som man kan behöva veta på ett sätt som är möjligt att förstå. Det finns etablerade sätt att göra det på, men det är en specialistkompetens som ofta ligger utanför forskarnas fokusområden.

När vi kombinerar våra styrkor blir det bra

− Vi forskare är ju inte bibliotekarier eller arkivarier, så vi vet inte automatiskt själva hur man ska göra så att vår data blir tillgänglig på bästa sätt. Men de som har den kompetensen vet i regel inte hur den här typen av dokument ska läsas och tolkas. När vi kombinerar våra styrkor blir det bra, konstaterar Per Ambrosiani.

Att sprida forskningsdata

Ett av de stora utvecklingsområdena inom forskningsstöd idag är att bygga upp infrastrukturer och standardiserade sätt att tillgängliggöra och sprida forskningsdata. Utvecklingen drivs på av forskningspolitiska mål och finansiärernas förväntning på att så mycket som möjligt av forskningens resultat ska göras så tillgängligt som möjligt. Forskningsdata räknas i allt högre grad som forskningsoutput med ett värde i sig, där fokus tidigare har legat på publikationer som artiklar och böcker. En målsättning är att göra forskningsdata FAIR – det vill säga möjlig att hitta vid sökningar, tillgänglig (åtminstone genom utförliga metadata), interoperabel med annan data och mellan olika program och system, samt möjlig att återanvända. I Sverige görs detta genom att forskningsdata registreras i den nationella forskningsdatakatalogen hos Svensk nationell datatjänst (SND).

− Du som är forskare kan registrera din databas hos SND. Du kan ditt material bäst och beskriver det så utförligt som möjligt i de fält som finns i deras tjänst DORIS. När registreringen har gjorts skickas den på granskning till oss på biblioteket. Det kan hända att vi kontaktar dig för uppföljande frågor, eller om vi upptäcker att något saknas, berättar Sanna Isabel Ulfsparre.

När registreringen slutligen publiceras skapas också permanenta länkar, DOI. DOI är en länk som håller över tid. Detta gör det bland annat möjligt att länka mellan forskningsdata och publikationer med resultat från forskningen, samt för andra att referera till forskningsdata i andra arbeten.

Ett av målen med de infrastrukturer som byggs upp nu är att öka spridningen av forskningsdata genom att metadata dels blir maskinläsbar och dels genom att metadata kan hämtas av och visas i andra databaser. Grunddatat kan ligga stabilt och dolt på en säker lagringsplats om det finns anledning till det – huvudpersonen i spridningsprocessen är metadatabeskrivningen. En katalog som den nationella forskningsdatakatalogen blir därmed en källa till information för databaser och forskare över hela världen. Något liknande sker redan med andra publikationer, till exempel hämtar andra databaser metadata om vårt universitets publikationer från databasen DiVA. På så vis blir publikationerna sökbara på flera ställen, men behöver bara registreras en gång.

Genom att permanenta länkar används för att koppla ihop forskningsdata med relaterade publikationer och annan relaterad forskningsdata sprids kunskapen om den på ett sätt som liknar citeringar och referenser till andra forskningspublikationer. För Smolenskarkivet innebär det en möjlighet för databasen att hållas levande.

Vi i projektet hoppas att Riksarkivet kan ta över ansvaret så att det får leva vidare

− Vi i projektet hoppas att Riksarkivet kan ta över ansvaret så att det får leva vidare. När det skrivs ny litteratur utifrån materialet så vill vi att det kan uppdateras i databasen och att det kan hänvisa dit, säger Per Ambrosiani.

− Den typen av uppdateringar kring nya publikationer och dataset kan ske genom kopplingar via metadata i forskningsdatakataloger och på publiceringsplattformar. På så sätt behöver man inte fortsätta gå in och redigera i själva forskningsdatabasen, svarar Sanna Isabel Ulfsparre.

SND:s forskningsdatakatalog byggs upp i ett europeiskt sammanhang, med fokus i första hand på interoperabilitet gentemot infrastrukturer inom EU.

− Vi är en ganska liten grupp forskare i Sverige som är intresserade av det här materialet. Därför är det också viktigt att arbeta för att nå ut, så att alla vet att detta finns tillgängligt nu, säger Per Ambrosiani.

Smolenskarkivet är även intressant för forskare i Ryssland och den ryske historikern Adrian Selin vid forskningsuniversitetet Ekonomihögskolan i S:t Petersburg har även gjort en stor insats i arbetet med databasen.

På sikt kanske vi får ett globalt system där databaser hämtar metadata från varandra, men än så länge är vi inte riktigt där

− När man är flera forskare från olika länder som samarbetar i ett sånt här projekt så kan man ta hjälp av varandras lokalkännedom för att hitta bra spridningsvägar, tipsar Sanna Isabel Ulfsparre och fortsätter:

− På sikt kanske vi får ett globalt system där databaser hämtar metadata från varandra, men än så länge är vi inte riktigt där.

Framtiden för forskningsdata

Allt pekar på att publicering och tillgängliggörande av forskningsdata är här för att stanna. Så vad innebär det för forskarnas framtid?

– Yngre forskare vill ju ha detta som en merit. Publicering har blivit valuta och det här är också en slags publicering, menar Per Ambrosiani. Samtidigt har arbete med att ta vara på och organisera forskningsdata ofta inte setts som särskilt värdefullt ur meriteringssynpunkt.

– Jag tror att i samband med att finansiärerna börjar kräva öppenhet så kommer det att bli meriterande att publicera forskningsdata öppet. Men det är en guppig väg och en kulturförändring som tar tid, konstaterar Sanna Isabel Ulfsparre.

− Vi ser även att förlagen börjar vilja ha kopplingar mellan artiklar och beskrivningar av forskningsdata, säger hon.

– Om man redan under pågående forskning kan hitta fram till ett arbetssätt där forskningsdata organiseras på ett strukturerat och medvetet sätt så behöver det inte heller vara så betungande att överföra informationen till en metadatabeskrivning när det börjar bli dags att publicera sig. Man måste ju ändå hantera sin forskningsdata under forskningens gång. Det handlar bara om att göra det medvetet och metodiskt. En datahanteringsplan är till god hjälp för att kunna göra detta på ett konsekvent sätt över tid, avslutar Sanna Isabel Ulfsparre.

Länk till databasen på Riksarkivet

Information om hur materialet får användas och spridas

Texten i reportaget är publicerad med öppen tillgång.

När du använder materialet ska följande information, inklusive länkar, finnas med som licensinformation:

"Att möjliggöra forskning - forskningsdata för framtiden" av Susanne Sjöberg och Sanna Isabel Ulfsparre har en CC BY 2.0-licens

Om du gör ändringar på något sätt ska det framgå i samband med licensinformationen. 

Material som inte explicit nämns i denna information ingår inte i licensen.