Information till medarbetare med anledning av covid-19 (Uppdaterad: 6 augusti 2020)

Hoppa direkt till innehållet
printicon
Publicerad: 26 jun, 2020

Att leta upp rimliga resultat ur komplexa träddata

NYHET Hur en växt fungerar beror på komplexa interaktioner mellan gener, proteiner och metaboliter. Att identifiera och analysera dessa genetiska egenskaper är mycket utmanande, särskilt när sekvensen av genomet (arvsmassan) inte är så bra som man skulle önska. Bastian Schiffthaler har förbättrat genominformationen från europeisk asp och utvecklat bioinformatikverktyg för att analysera interaktioner mellan gener och proteiner.

Text: Carolin Rebernig/Ingrid Söderbergh

När man sekvenserar en genuppsättning (ett genom), delas DNA normalt upp i enorma mängder små bitar. Bitarnas DNA-sekvens bestäms och sedan använder man avancerade dataprogram för att pussla ihop informationen till överlappande regioner av de små bitarna i en iterativ process som till slut i idealfallet kan återskapa kromosomer i sin fulla längd. För träd, som ofta har mycket komplexa genom, är de flesta tillgängliga genomsekvenserna inte särskilt sammanhängande. Bastian Schiffthaler har i sin avhandling arbetat med att förbättra sekvenserna och metoderna med fokus på europeisk asp.

Genomsekvensen för asp är redan ganska bra jämfört med till exempel gran men den är fortfarande fragmenterad vilket gör det svårt att utföra vissa analyser. Exempel på detta är så kallad Genome-wide association studies, GWAS, eller studier av trädens evolutionära historia.

– Vi använde de senaste metoderna för genomsekvensering som ger långa sekvenser sekvensering, tillsammans med mycket exakta korta sekvenser, och kunde på så sätta ihop bitarna till längre segment, som sedan kunde kopplas samman till hela kromosomer. Eftersom vi använt närmare 20 000 genetiska markörer är den genetiska kartan en av de mest ambitiösa som skapats för någon organism hittills. Det var en överväldigande mängd information som vanligt använda gratisprogram inte kunde hantera, säger Bastian Schiffthaler.

Att göra dessa analyser ”helt perfekt” även om bara sextio markörer skulle ta fler beräkningar än det finns atomer i universum. Därför måste all programvara förlita sig på approximationer, men även de tidigare använda sådana är för långsamma för ett dataset av denna storlek.

För att lösa problemet utvecklade Bastian Schiffthaler "BatchMap", ett programvarupaket som snabbar upp dessa beräkningar. Programvaran delar upp beräkningar i små delar, som är enkla att beräkna och kan hanteras parallellt. Detta minskade drastiskt beräkningstiden och Bastian Schiffthaler kunde producera en oerhört exakt karta över genetiska markörer för den aspens kromosomer. Sedan ”BatchMap” skapats har programvaran använts av andra genomprojekt till exempel av de som studerar gran och jordgubbar.

– Vi ville utvärdera den nya genkartan för att med GWAS leta efter gener som styr metablismen av så kallade salicinoider. Dessa ämnen finns endast i arter av Populus och Salix och hjälper till att skydda växten mot växtätare. Jämfört med tidigare försök med den mer sämre kartan kunde vi se att vår nya genomversion förbättrade analysen av denna komplexa egenskap mycket och vi kunde bättre förstå i utvecklingen av de olika Populus-arterna, förklarar Bastian Schiffthaler.

Att identifiera gener som kontrollerar mer komplexa egenskaper är en stor utmaning. Bastian Schiffthaler studerade också variation i bladform i europeisk asp, en komplex egenskap som ärvs från föräldrarna men som fortfarande är mycket olika mellan individer. Resultatet visar att bladformen styrs av ett komplext nätverk av många olika gener, men där varje gen ofta har endast ett litet inflytande på den slutliga bladformen. Andra egenskaper, till exempel människans längd, styrs på liknande sätt.

Bastian Schiffthaler antog att för att bättre förstå funktionerna hos egenskaper som bladform behövs en integrerad strategi där egenskaper analyseras i alla stadier som bidrar till bladens tillkomst. Han utvecklade därför "Seidr", ett verktyg för att studera interaktioner mellan gener som aktivt görs till protein i en organism.

– Jag hoppas att integrering av "Seidr" med andra typer av data skall göra det möjligt för forskare att bättre förutsäga komplexa egenskaper i träd i framtiden.

 

Läs hela avhandlingen

Pressbild. Foto: Alena Aliashkevicho

 

Om disputationen:

Fredagen den 12 juni försvarade Bastian Schiffthaler, Institutionen för fysiologisk botanik vid umeå universitet, sin avhandling med titeln: Embracing the Data Flood – Integrating Diverse Data to Improve Phenotype Association Discovery in Forest Trees.

Fakultetsopponent var Marek Mutwil, the School of Biological Sciences at Nanyang Technological University in Singapore, som deltog via länk. Handledare var Nathaniel Street. Disputationen live-stremades och intresserade kunde delta via Zoom.

För mer information, kontakta gärna:

Bastian Schiffthaler
Forskningsassistent
E-post
E-post
Telefon
090-786 54 78