Lover DNA-analyse på få timer
elPrep5 Big Data Platform kan utføre DNA-analyse opptil 16 ganger raskere enn tidligere alternativer. Egentlig er det en liten, stille revolusjon.
Denne artikkelen er 2 år eller eldre
imec, det belgiske forskningsinstituttet for nanoelektronikk og digital teknologi, har lansert elPrep5, sin nyeste versjonen av programvareplattformen for DNA analyse. Med samme resultat som tidligere er elPrep5 åtte til 16 ganger raskere enn referansestandarden for genomeanalyse – Genome Analysis Toolkit (GATK).
Imec-plattformen omfatter hele analysekjeden fra dataklargjøring til variant-kall på en lignende maskinvareinfrastruktur. Dette skal åpne for nye muligheter og effektivitetsgevinster for sykehus og leger.
– Dette er gjennombruddet vi har ventet på i mange år. Endelig kan vi kjøre hele DNA-analysen med en enkelt programvareplattformløsning, og raskere enn noensinne, sier imec-forsker Dr. Charlotte Herzeel. – Fordi variant-kall er det mest komplekse trinnet, og med resultatinnsamling opptil 16 ganger raskere enn forrige metode, har vi fått en tidsreduksjon på fire til ni ganger. Samtidig som GATK4-identiske resultater beholdes. For medisinsk sektor er dette enorme effektivitetsgevinster fordi tiden mellom prøvetaking og diagnose reduseres dramatisk, og leger kan kjøre analyser over natten. Og siden mange sykehus kjører sine analyser via leide skyløsninger, har reduserte gjennomføringstider også resultere i en kostnadsreduksjon pr analyse.
Etter at en DNA-prøve er sekvensert, er det hundrevis av gigabyte med data som representerer den genetiske informasjonen i den opprinnelige prøven, og som i sekvenseringsprosessen, blir kuttet i en mengde mindre fragmenter. Disse fragmentene må rekonstrueres til en representasjon av original DNA-prøve. Etterpå utføres en analyse til, for eksempel for å oppdage genetiske varianter i forhold til en kjent referanse modell, og elPrep 5 er spesielt laget for å optimalisere denne variant-kall-analysen.
Å utføre denne analysen er en beregningstung utfordring. Til tross for betydelige kostnadsreduksjoner for DNA-analyse det siste tiåret, kjøretider – opptil to til tre dager for et helt genom – var fortsatt noe som kunne forbedres. Nå kan imecs elPrep5 utføre en hel genomanalyse innen noen få timer uten at det går ut over kvaliteten på utdataene. Omfattende valideringer viser helt identiske utganger til sine bransjekolleger i GATK, SAMtools og Picard.
Ved å utnytte rammeverket for parallell eksekvering, utfører elPrep5 den komplette analysen etter en enkel gjennomgang av dataene. Denne arkitekturen unngår de intensive lese- og skriveprosessene til fragmenter av data inn og ut av minnet. elPrep5 er skrevet i Go, et åpen kilde programmeringsspråk utviklet av Google, og kan kjøres på standardservere som de fleste sykehus har lokalt eller i skyen. elPrep5 utvider og forbedrer elPrep4-funksjonaliteten og ytelsen ved å inkludere variant-kall som det siste trinnet for å inkludere hele analysekjeden.
elPrep5 retter seg mot farmasøytisk industri, vitenskapelig forskning, medisinske laboratorier, tjenesteleverandører av sekvensering, sekvenseringsleverandører og sykehus. Med raskere analyse mener imec at elPrep5 gjør det mulig for disse næringene å gå fra forskning til klinisk praksis og ytterligere skalering av virksomheten.
Flere industripartnere har allerede gjort det uttrykt interesse for å integrere elPrep5 i deres daglige drift.