Hoppa direkt till innehållet
printicon
Huvudmenyn dold.
Publicerad: 20 jun, 2018

Datorer kan förstå bilder på samma sätt som konstnärer

NYHET Föreställ dig datorer som kan förstå målningar eller måla abstrakta bilder på nästan samma sätt som människor. Bo Li har i sitt avhandlingsarbete utvecklat ett banbrytande koncept inom datorseende, interest curves, som baserar sig på kurvor och linjer och breddar området för datorers uppfattning av bilddetaljer. Han försvarar sin avhandling den 27 november vid Umeå universitet.

Med vår mänskliga perception kan vi känna igen föremål genom bilddetaljer så som former och kurvor. Vi kan till exempel identifiera ansikten, djur, bilar och andra vardagsobjekt i enkla skissbilder men för datorer är denna uppgift väldigt utmanande.

Datorseende är ett område som arbetar med att bygga "seende datorer", vilka automatiskt bearbetar och "förstår" innehållet i digitala bilder. Forskningsområdet är i snabb utveckling och noggrann modellering av bilddetaljer är mycket viktigt inom ett brett spektrum av tillämpningar, till exempel bildregistrering, 3D-rekonstruktion och objektdetektering. I framtida teknik såsom Google Car, virtuell verklighet (VR), eller inom artificiell intelligens (AI), kommer bilddetaljer fortfarande vara grundläggande komponenter. Trots att hundratals lösningar för detektering av bilddetaljer redan existerar, har ett stabilt koncept hittills saknats.

Interest curves uppfattade av en dator.

Bo Li har utvecklat ett koncept som innebär ett genombrott inom fältet datorseende: så kallade interest curves.

– Med denna metod kan en dator rita bilder med penseldrag. Interest curves kan också användas av datorn för att känna igen föremål på ett mer exakt sätt, säger Bo Li.

Konceptet ger helt nya möjligheter för förståelse av bilddetaljer, inklusive punkter, regioner, linjer och kurvor. Det gör också att alla dessa funktioner kan rymmas inom samma teoretiska ramverk. Resultatet innebär inte enbart ett teoretiskt framsteg för framtida forskning kring bilddetaljer, det ger också praktisk vägledning till området.

Den viktigaste komponenten för att hitta bilddetaljer är stabilitet, enligt Bo Li. Hans resultat visar att den nya metoden gör de kurvor och linjer som skall detekteras stabila trots bildtransformationer och störningar i bilderna.

Förut har kurvor och linjer inom datorseende inte varit lika populära att använda som punkter och regioner, eftersom de saknar tillräckligt med robusthet. Bo Lis nya teori och algoritmer ändrar nu på detta.

– Kurvor och linjer är naturligt mer användbara än punkter, eftersom människor använder dessa former för att beskriva världen, förklarar Bo Li.

Hans avhandlingsarbete visar på många fördelar med att använda kurvfunktioner för tillämpningar inom datorseende.

Avhandlingen har publicerats digitalt

För mer information, kontakta gärna:

Bo Li, Institutionen för tillämpad fysik och elektronikTelefon: 076-025 82 01, 090-786 68 24
E-post: bo.li@umu.se

Pressbild för nedladdning. Foto: privat

Bo Li kommer från Kina. Han har kandidatexamen inom automation från Tianjin University, Kina, 2006. Sedan studerade han vidare och tog en masterexamen i intelligenta system och robotik vid University of Essex, Storbritannien år 2009. Året därpå påbörjade han forskarstudier i signalbehandling vid Umeå universitet. Hans forskningsintressen inkluderar bildbehandling, mönsterigenkänning och robotik.

Om disputationen:

Fredagen den ​​27 november försvarar Bo Li, Institutionen för tillämpad fysik och elektronik vid Umeå universitet, sin avhandling med titeln: Interest curves: Concept, Evalutation, Implementation, and Application. På svenska: Interest curves - Koncept, utvärdering, genomförande och applikationer.

Disputationen äger rum kl. 13.00 i MIT-huset, rum MA121.

Fakultetsopponent: Professor emeritus Björn Kruse, Institutionen för teknik och naturvetenskap, Linköpings universitet.

Handledare: Ulrik Söderström vid institutionen för tillämpad fysik och elektronik, Umeå universitet, och Haibo Li vid Skolan för datavetenskap och kommunikation, KTH i Stockholm.

Redaktör: Ingrid Söderbergh