Hoppa direkt till innehållet
printicon
Huvudmenyn dold.

Aktuella exjobb - institutionen för datavetenskap

Det är dags att fundera på din framtid och därmed också ditt exjobb. Här listar vi några tips på forskargrupper och företag som kan vara intressanta!

Samarbeta med oss

Söker du studenter till din forskargrupp eller företag och vill vara med på denna lista? Kontakta Jan-Erik Moström, studirektor vid institutionen för datavetenskap vid Umeå universitet. 

Exjobb – våra forskargrupper

Ericsson Internship/masteruppsats: Automatisk segmentering för semantisk SLAM-dataset

Läs mer på den engelska sidan.

Xjobb inom programvaruutveckling eller datorsäkerht? (15/30hp)

I forskningsgruppen för programvaruutveckling och datorsäkerhet försöker vi förbättra kvalitén på mjukvara genom att identifiera och eliminera svagheter genom hela livscykeln - från design och implementation till leverans och drift. Vi utvecklar verktyg och metoder för att analysera, testa och förstå mjukvara, men även för att hitta/skydda kod från buggar och förebygga attacker. Vår forskning påverkar direkt system som används i samhället: Covid-tester kan läcka personuppgifter

Vår forskning är fokusera på olika ämnen inom programvaruutveckling och datorsäkerhet, t.ex.:

  • Programvarutestning
  • Analys av program
  • Analys av skadliga program (malware)
  • Reverse engineering
  • Hur svagheter i system utnyttjas och förbyggs
  • Skyddande av data
  • Integritet

Planerar du att göra ditt xjobb, både 15hp och 30hp, inom programvaruutveckling och/eller datorsäkerhet? Kontakta då Prof. Alexandre Bartel: alexandre.bartel@cs.umu.se or 072 208 73 56.

Är du en snabb problemlösare som gillar att arbeta i team och vill arbeta inom robotik/AI? (30hp)

Intelligent Robotics Research Group vid Umeå universitet utvecklar formella och informella metoder för intelligent robotbeteende – exempelvis visuell uppfattning och naturlig språkanvändning. Vi är intresserade av algoritmutveckling, interaktions- och designstudier och söker dig som vill arbeta inom robotik/AI, är en fena på att kommunicera och trivs med att arbeta i grupp.

För mer information
Vänligen kontakta Thomas Hällström, professor vid institutionen för datavetenskap, via e-post: thomash@cs.umu.se så diskuterar vi ett passande avhandlingsarbete (30hp).



Sekretess vid maskininlärning, medicinsk bildbehandling och automatisering (30hp) 

Maskininlärning har blivit mycket viktigt inom medicinska vetenskaper som verktyg att automatisera till exempel diagnos och prognos, och att personanpassa medicin och behandlingar. Maskininlärning används till exempel vid medicinsk bildbehandling för att automatisera delar av strålbehandlingsplaneringen efter en cancerdiagnos. Vår forskargrupp är nyfikna på vad som som exakt lärs om specifika patienter när man bygger djupa faltningsnätverk för medicinska bildtillämpningar. Eftersom modeller som tränats på patientdata ofta delas fritt online finns det potentiella integritetsfrågor som vi för närvarande inte helt förstår. Vi letar därför efter examensstudenter som är intresserade av dessa frågor.

För mer information
Om detta låter som något för dig, vänligen kontakta Tommy Löfstedt, universitetslektor vid institutionen för datavetenskap via e-post: tommy@cs.umu.se för mer information om detta, och andra potentiella projekt.

Vill du arbeta med ansvarsfull AI-design och humancentrerad AI? 

The Responsible Artificial Intelligence Group är särskilt intresserade av att studera den etiska och samhälleliga effekten av AI och utveckla verktyg och metoder för att mildra negativa effekter, liksom agenter som bättre kan interagera till människor och samhällen. Vi är öppna för en mängd olika förslag, alltifrån etiska bedömningar, till att använda våra designmetoder och verktyg för konkreta tillämpningar; från hård programvara för demonstrationer till vetenskaplig verksamhet. Exempelvis utvecklar vi en kognitiv komponent för att hantera ångest och hur man kan undvika detta, och här strävar vi nu efter att göra en tilltalande demo. Vad händer t ex om vi skulle utöka ett videospel med en orolig karaktär? Eller om man gör ett häftigt VR-spel där spelaren kan hantera den stressnivå som hen troligen kommer att möta, istället för "svårighetsgrad" i spelet?

För mer information
Vänligen kontakta Loïs Vanhée universitetslektor vid institutionen för datavetenskap via e-post: lois.vanhee@umu.se så pratar vi vidare.

AI-stöd för kunskapsinsamling mha heterogen dataanalys och federation (15hp och 30hp)

Deep Data Mining Group har arbetat med multimodal heterogen dataanalys och datafederation genom att tillämpa teknikerna för textanalys, informationshämtning, naturlig språkbehandling, maskininlärning och differentiell integritet. Det huvudsakliga forskningsämnet är datadrivet och applikationsorienterat såsom enhetsbaserad social nätverksanalys (t.ex. känslor, känslor, politisk syn etc.), personlig integritetsanalys och ontologibaserad kunskapsgrafkonstruktion etc. Dessutom har gruppen flera kopplingar till industrin och den akademiska världen som är intresserade av att samhandleda masteruppsatsprojekt, där vi kan genomföra intressant AI-tvärvetenskaplig forskning (t.ex. spårning och inferens av Covid-pandemihändelser, medicinsk screening, energiförbrukning och anomaliprognos, genetik & hälso- och sjukvård etc.). Vi vill gärna ha en diskussion med dig om vad som kan vara ett lämpligt examensarbete för just dig.


För mer information
Om du är intresserad är du välkommen att kontakta Lili Jiang, docent vid institutionen för datavetenskap via e-post: lili.jiang@cs.umu.se om ett lämpligt examensarbete.

Moln/edge + AI + hyperdistribuerade applikationer (30hp)

Autonomous Distributed Systems Lab: Gruppens huvudfokus är nya moln/edge-teknologier med förbättrad prestanda med hjälp av AI för den databehandling som krävs för att stödja framtida hyperdistribuerade applikationer. Baserat på ett sådant moln/edge undersöker vi datamarknader och dataekonomi; vi letar därför efter studenter som vill göra sitt examensarbete (30 hp) i vår grupp. Mer specifikt har vi flera öppningar inom:

a) Datamarknader som gör det möjligt att upptäcka datatillgångar, effektivt och rättvist prissatta och delas / handlas på ett kompatibelt sätt.

b) Skalbar och AI-driven datahantering för datainvändbarhet i olika sammanhang, som täcker data provenens, datakvalitetshantering, förbättrad datakompatibilitet och metadatahantering.

För mer information
Kontakta Antonio Seo,  eunil.seo@cs.umu.se, för att diskutera/definiera ett examensarbete.

Förbättrad förståelse för träningens betydelse för djupa neuronnät

Vid träning av djupa neuronnätsmodeller i maskininlärning så använder man ofta olika varianter av stokastiska gradientmetoden. En hypotes om varför djupa neuronnät kan generalisera så väl som de gör, trots att de typiskt har många gånger fler parametrar än träningsdata, är just användningen stokastiska gradientmetoden. Hypotesen säger att med stokastiska gradientmetoden föredras vida lokala minima över smala lokala minima, att stokastiska gradientmetoden har förmågan att "skaka sig ur" lokala minimima om de är för smala.

Målet med detta projekt är att undersöka olika sätt som stokastiska gradientmetoden kan fungera som en form av regularisering av modellen, dvs. hur den kan motverka modellens tendens att överanpassa till träningsdatat. Det finns flera olika sätt att testa detta, och projektet innebär implementation och testning av ett antal olika varianter och jämföra teoretiska och praktiska resultat.

För mer information
Om detta låter intressant, kontakta Tommy Löfstedt, universitetslektor vid Institutionen för datavetenskap, via e-post: tommy@cs.umu.se för mer information om detta, och andra potentiella projekt.

Matriskedjeproblemet med symboliska storlekar (30hp)

Givet en produkt av 3 eller fler matriser (en kedja), så kan den optimala sekvensen av matrismultiplikationer (av två matriser) beräknas på polynomiell tid. Vi har i tidigare arbeten studerat "generaliserade matriskedjor", det vill säga produkter där var och en av matriserna kan vara transponerad och/eller inverterad. Det här projektet syftar till att lösa en variant av problemet där storlekarna på matriserna inte är helt kända, det vill säga en eller flera matrisdimensioner är obekanta vid tiden för kompilering.

Artikel refererad ovan: "The Generalized Matrix Chain Algorithm"

För mer information
Kontakta Paolo Bientinesi, pauldj@cs.umu.se, 0720 856 180 för mer information.

Organisation av elektronisk musik genom att reducera antalet dimensioner (30hp)

Givet ett stort antal musikstycken (genre: elektronisk dansmusik) så är målet att identifiera ett mätvärde för att kunna avgöra om olika musikstycken är 'nära' eller 'långt borta' från varandra. Ett sådant mätvärde kan sedan utgöra en del av rekommendationssystem för att automatiskt mixa musik. I praktiken så är varje musikstycke en punkt i en rymd med extremt många dimensioner som motsvarar olika egenskaper som t.ex. takt och tonart. Dessa egenskaper identifieras med hjälp av signalbehandling. Projektet syftar till att identifiera olika projektioner från denna rymd till en rymd med betydligt färre dimensioner.

Den naturliga startpunkten för detta projekt är en teknik som kallas "t-distributed stochastic neighbor embedding". Du hittar en översiktsartikel här.

För mer information
Kontakta Paolo Bientinesi, pauldj@cs.umu.se, 0720 856 180 för mer information.

Högpresterande kärnor för tensorberäkningar (30hp)

I en tidigare undersökning så identifierade vi att samma arbete utfördes på flera platser. Trots betydelsen av tensorer, och den stora användningen, så saknas ett bibliotek motsvarade BLAS. Med detta projekt så vill vi skapa ett konkret förslag för en uppsättning av högpresterande kärnor som kan användas i de områden där beräkningar sker med hjälp av tensorer. Exempel på områden finns från maskininlärning, data science till computational chemistry och computational mechanics.

Artikel refererad ovan "The landscape of software for tensor computations"

För mer information
Kontakta Paolo Bientinesi, pauldj@cs.umu.se, 0720 856 180 för mer information.

MatchC: ett C/C++ bibliotek för mönstermatchning (30hp)

Mathematica (Wolfram) erbjuder den mest avancerade mönstermatchningen i något programspråk. Ett motsvarade bibliotek i C/C++ skulle, även om det vore begränsat i egenskaper och funktionalitet, vara ett extremt användbart byggblock för ett stor mängd applikationer. Målet med detta projekt är att utveckla ett högpresterande bibliotek för mönstermatchning, med associativa och kommutativa operatorer med begränsningar, såväl som enstaka och multipla matchningar (liknande ./+/* i reguljära uttryck) samt parallelism i delat minne.

Vi har tidigare utvecklat MatchPy som är ett Python-bibliotek för mönstermatchning. MatchPy utgör en naturlig startpunkten och referens för detta projekt. Se även "Efficient Pattern Matching in Python"

För mer information
Kontakta Paolo Bientinesi, pauldj@cs.umu.se, 0720 856 180 för mer information.

Vill du upptäcka och begränsa nya cyberattacker, eller skydda användarnas privata data eller bygga storskaliga ML-system? (30 hp)

Autonomous Distributed Systems Lab - en del av vårt lab forskar på säkerhet och integritet, distribuerad maskininlärning (ML), pålitliga maskininlärningsfrågor för att bygga intelligenta, anpassningsbara, pålitliga och motståndskraftiga system som fungerar i komplexa och verkliga miljöer. För att hjälpa till med vår forskning söker vi för närvarande masterstudenter som vill göra sitt examensarbete (30 hp) i vår grupp. Frågeställningar kring möjliga projekt:

  • Hur upptäcker man nya cyberattacker (t.ex. distribuerade denial of service attacker) i komplexa system?
  • Hur kan man mildra cyberattacker i storskaliga och komplexa system?
  • Hur kan man maximera upptäckningsförmågan hos (djupa) ML-algoritmer samtidigt som datasekretess bevaras användandes en minimal mängd resurser?
  • Hur säkerställs dataosäkerhet tillsammans med integritet i federerat lärande?
  • Hur optimerar du prestanda för ML-kluster via schemaläggnings- och sprintpolicies?
  • Hur lär man sig av små mängder data i både begränsade och icke-begränsande miljöer?
  • Hur skyddar man användares privata data när man tränar ML-system på edge resurser (dvs nära slutanvändare i nätverk)?
  • Hur bygger man pålitliga och motståndskraftiga storskaliga ML-system i attackerade miljöer?
  • Hur upptäcker man avvikelser i multimodalt data under icke-standardiserade modellinställningar?

För mer information

Ser detta intressant ut, kontakta Monowar Bhuyan för mer information. monowar@cs.umu.se

 

Exjobb – externa partners 

"Hey Computer! Please read this text and tell me the keywords!"

Adlede jobbar med kontextuell annonsering för nyhetsartiklar och vi använder maskininlärning till att analysera tusentals nyhetsartiklar varje dag. Vi vill undersöka metoder för att hitta nyckelord i artiklar. T.ex. i meningen "Nivåerna av koldioxid i atmosfären ökar" är orden "nivåerna", "atmosfären" och "koldioxid" mer beskrivande/unika än "av" och "i". Ett vanligt sätt att avgöra hur viktiga orden är med tekniken TF-IDF. Vi vill undersöka smartare tekniker, t.ex baserade på BERT-embeddings.

Målet är att skapa en intelligent nyckelord-extraherare för nyhetsartiklar. Studenten kommer att få experimentera med NLP-relaterade bibliotek i Python, jobba med lemmatisering och andra pre-processeringstekniker, och om tid finns, delta i implementationen i vårt produktionssystem.

För mer information

Kontakta Anton Eklund anton@adlede.com

Användning av maskininlärningsmetoder för att identifiera mönster av plantor som svar på torkabehandling med hjälp av time-lapse-bilder

Målet med det föreslagna projektet är att använda ML-verktyg för att lära sig förutsägande mönster av respons på torka i tallplantor som exponeras för torka med hjälp av tidsförloppsbilder. Maskininlärning (ML) metoder som djupinlärning, elastiskt nät och lasso har testats för att träna modeller för organismer och objektigenkänning. Fokus inom detta projekt är att träna ML-modeller för att identifiera mönster för förändringar av tallfröplantor som svar på torka. Modellträning kommer att göras på bilder som erhållits genom time-lapse-avbildning under processen med torkabehandling.

För mer information
Om detta låter intressant, kontakta Rosario Garcia Gil, vid Institutionen för fysiologisk botanik, via e-post: m.rosario.garcia@slu.se för mer information.

Träning av maskininlärningsmetoder för tolkning av genetiska effekter på trädegenskaper

Utveckling av kostnadseffektiv DNA-sekvenseringsteknologi erbjuder möjligheten att generera genomdata för tusentals individer, vilket öppnar möjligheten att tillämpa maskininlärningsmetoder för att skapa prediktiva relationer mellan en organisms genotyp och fenotyp. I en nyligen genomförd studie på jäst, ris och vete fann man att nästan alla standardmetoder för maskininlärning överträffade metoderna från klassisk statistisk genetik. Målet med det föreslagna projektet är att utveckla en effektiv maskininlärningsmetod för att lära sig prediktiva samband mellan exomets genomdata (genomisk DNA-information) och granars tillväxt och vedegenskaper.
 
För mer information
Om detta låter intressant, kontakta Rosario Garcia Gil, vid Institutionen för fysiologisk botanik, via e-post: m.rosario.garcia@slu.se för mer information.

 

Vill du arbeta tvärvetenskapligt med medicinsk teknik på Region Västerbotten? (15/30 HP)

MT-FoU bedriver forskning, utveckling och utbildning i nära samarbete med sjukvården. Ett flertal forskningsprojekt pågår där du kan göra ett examensarbete om 15 eller 30hp. Medicinteknik är ett tvärvetenskapligt område och examensarbeten är möjliga inom exempelvis fysik, elektronik, datavetenskap, interaktion och design, fysioterapi och medicin. Exjobb baseras på kliniska behov och aktuella frågeställningar inom pågående forskningsprojekt. Arbetet inkluderar ofta utveckling av hård- och mjukvara för att mäta, analysera eller simulera fysiologiska signaler.

För mer information

Vänligen kontakta Helena Grip, Sjukhusingenjör, docent i medicinsk teknik och adjungerad universitetslektor, inriktning mot medicinsk teknik och rörelseanalys, via e-post: helena.grip@regionvasterbotten.se eller telefon: 090-785 40 29

Utveckla nya features för internationella Evity?

Evity är en startup från Umeå som utvecklar ett HR-verktyg för små och medelstora företag. Vi använder automation och formulärverktyg för att skapa nyckeltal och processer i verktyget. Nu söker vi en student som vill arbeta i .net inom Azure där vi kan hitta ett samarbete för att utveckla nya features eller förbättra befintliga. Vi är ett internationellt team med co-founder och CTO från Nya Zeeland. Läs mer om oss på www.evity.hr.

För mer information
Vänligen kontakta VD Tommy Eriksson, Evity på telefon: 070-696 70 22 eller e-mail: tommy@evity.hr

Intresserad av öppen källkodssamling baserad på toppmoderna djupinlärningsmodeller och metoder för medicinsk avbildning? (30hp)

NONPI Medical AB utvecklar och implementerar programvaruverktyg för medicinsk bildanalys. Det föreslagna projektet fokuserar på djupinlärningsmetoder för medicinsk bildbehandling, t.ex. tumörsegmentering, superupplösning eller snedvridningskorrigering.

Det finns många olika ramverk att välja mellan för implementering av djupinlärningsmodeller, vilket är bra för utveckling och forskning, men detta delar samtidigt också upp fältet och publicerad kod i fraktioner, beroende på vilket ramverk som användes. Resultatet blir att fältet är uppdelat och resultaten blir svåra att reproducera mellan användare av olika ramverk. En öppen källkodstandard för maskininlärningsmodeller har upprättats (ONNX), men detta är ännu inte ett vanligt använt format och speciellt inte inom forskning och utveckling av medicinsk bildbehandling.

För att hjälpa till att sprida utvecklade modeller och ONNX-formatet letar vi för närvarande efter magisteruppsatsstudent(er) (30hp) som vill skapa en öppen källkodssamling med toppmoderna djupinlärningsmodeller och metoder för användning inom medicinsk bildanalys. Vi tänker främst på sådana som vunnit större tävlingar, toppmoderna modeller och modeller från välciterade forskningsartiklar.

Projektet består i att samla in och kategorisera förtränade djupinlärningsmodeller, konvertera dem från flertalet olika format till ONNX-formatet och testa dem på medicinska bilddata i MICE Toolkit, en mjukvara för medicinsk bildanalys som utvecklas av NONPI Medical AB.

För mer information
Om du är intresserad av att lära dig mer om projektet eller hur vi använder avancerade djupinlärningsmodeller, vänligen kontakta: attila@nonpimedical.com

 

Djupinlärningsmodeller för medicinsk bildbehandling

NONPI Medical AB utvecklar och implementerar programvaruverktyg för medicinsk bildanalys. Det föreslagna projektet fokuserar på utveckling av verktyg för att designa, förändra och träna djupinlärningsmodeller samt hela maskininlärningspipelines för medicinsk bildbehandling, såsom t.ex. för tumörsegmentering, superupplösning eller snedvridningskorrigering.

Det finns ett stort intresse inom t.ex. strålbehandling att använda djupa maskininlärningsmodeller, men många inom detta fält saknar rätt bakgrund för att göra ingående förändringar i befintliga modeller, eller för att utveckla egna modeller från grunden. Med detta som bakgrund har NONPI Medical AB utvecklat ett grafiskt verktyg för att definiera arkitekturen till djupinlärningsmodeller. Det befintliga verktyget är däremot byggt ovanpå Python, vilket tillför ett extra lager av komplexitet då det övriga programmet är skrivet i C#, samt problem när det underliggande djupinlärningsramverket förändras.

I detta projekt är målet att utvärdera olika metoder för att bygga djupinlärningsmodeller i C#, samt att hitta effektiva grafalgoritmer för att exekvera olika steg i en maskininlärningskedja på tillgängliga hårdvaruresurser.

Målet med dessa utvecklingar är att hjälpa till att möjliggöra användningen av befintliga djupinlärningsmodeller, samt att göra det möjligt för fler att kunna utveckla egna samt förändra och förbättra befintliga modeller och hela maskininlärningspipelines. NONPI Medical AB letar därför för närvarande efter magisteruppsatsstudent(er) (30hp) som vill utveckla sådana verktyg för användning inom medicinsk bildanalys.

För mer information
Om du är intresserad av att lära dig mer om projektet eller hur vi använder avancerade djupinlärningsmodeller, vänligen kontakta: attila@nonpimedical.com

AI för att förstå storskalig biologisk data

MIMS har med Johan Henrikssons forskargrupp etablerat ett nytt lab för att skapa single-cell data. Med denna metod så kan tusentals (rentav miljontals) celler mätas, en i taget. Den enorma datan gör det möjligt att ta ett nytt grepp för att förstå biologin där AI används för att bryta ner mätningarna till begripliga bestånsdelar.

Detta kommer med datalogiska utmaningar, från "hur kan vi med AI hitta en komprimerad datarepresentation?" till "hur hanterar vi effektivt flera terabyte med gles data?". Precis som partikelacceleratorn i CERN kräver biologin nu att vi löser avancerade datalogiska problem innan vi ens kan fundera på de biologiska frågorna.

Vi söker exjobbare på alla nivåer, från de som vill ta skapligt avgränsade problem till de som vågar försöka ge sig på helheten. Det är bra om du vill lära dig lite biologi. Python är numer vårt standardspråk, men vi använder även R, Java och C/C++ när situationen kräver det. 

För mer information

Vänligen kontakta Johan Henriksson, forskare vid MIMS. Se även vår hemsida, www.henlab.org