DNA kui usaldusväärne andmete salvestusruum

Biomolekulid salvestavad digitaalset teavet usaldusväärselt

DNA aluskood sobib ideaalselt andmesalvestuseks © mõttekoda
ettelugemist

Kõvaketta asemel: teadlased on DNAsse salvestanud suures koguses digitaalseid andmeid. Nad kodeerisid biomolekulide kujul kaks megabaiti tihendatud teavet - ja lugesid need siis ilma tõrgeteta välja. Eripära: meeskonna kasutatav meetod pole mitte ainult tõhus, vaid ka äärmiselt vastupidav. Sest isegi mitme kopeeritud DNA korral võiksid algandmed ikkagi suurepäraselt taastuda.

Inimkond toodab üha rohkem andmeid. Kuid samal ajal ähvardab digitaalne unustamine, kuna tänapäeva andmekandjad on üsna lühiajalised. Pideva tehnoloogia muutumise ja andmekandjate vähese vastupidavuse tõttu tuleb digitaalsete andmete arhiive tänapäeval regulaarselt kopeerida. See, mis on tavalisel kõvakettal, võib mõnekümne aasta pärast muidu loetamatu olla.

Kauakestev ja mitte kunagi vananenud

Selle probleemi edaspidiseks vältimiseks pöörduvad teadlased nüüd iidse looduse andmekandja: DNA poole. Nende põhikood mitte ainult ei talleta elusolendite geneetilist teavet. Ta on hea ka digitaalsete andmete salvestusena. Sest looduse koodkeel on väga sarnane arvutite binaarkeelega. Ainus erinevus: null ja null tähistavad andmeid kõvakettal, DNA-s on need alused A, C, T ja G.

Võrreldes tahke olekuga on biomolekulil siiski selge eelis: õigetes tingimustes säilitamisel võib see tuhandeid aastaid kahjustusteta kesta. "Erinevalt lintidest ja CD-dele pole see salvestuskandja kunagi vananenud - ja kui see juhtub, on meil muid probleeme, " ütleb Yaniv Erlich New Yorgi geenivaramu kohta.

Kaks megabaiti tähekoodina

Erlich ja tema kolleeg Dina Zielinski on nüüd muljetavaldavalt tõestanud, kui usaldusväärselt saab meie ühiskonna tohutuid andmeid DNA-s hoida. Nad kodeerisid DNA-na kuus faili - sealhulgas infoteoreetiku Claude Shannoni tekst, prantsuse film, arvutiviirus ja täielik arvuti opsüsteem. kuva

Nende kokkusurutud kujul kokku kahe megabaidi andmete teisendamiseks kasutasid teadlased spetsiaalset algoritmi - purskkaevu koodi -, mis koondati juhuslikult väikestesse pakettidesse ja koondati seejärel õiges järjekorras. Süsteem kodeerib teavet mitu korda. Sel moel ei lähe kaotsi andmed, isegi kui hilisema mälu mõned DNA nukleotiidid peaksid olema kahjustatud. Eripära: vaatamata üleliigse teabe lisamisele on kodeerimisprotsess väga tõhus.

Vigadeta vaatamata korduvale kopeerimisele

Üldiselt genereerisid Erlich ja Zielinski seega 72 000 DNA ahela pikkust koodi, milles iga ahel koosneb 200 alusest. See tähtede jada saatis nad laborisse, mis kasutas seda malli DNA molekulide sünteesimiseks. Siis saabus põnev hetk: kas nendest molekulidest saaks algse teabe kätte?

Tegelikult suutsid teadlased tarkvara abil oma andmeid õigesti dekodeerida. Palju hämmastavam: sama edu võib saavutada ka DNA koopiatega. Teadlased korrutasid polümeraasi ahelreaktsiooni abil uuesti ja uuesti biomolekulid. Nii neid kui ka nende koopiaid ja nii edasi tehtud koopiaid saab ilma vigadeta dekodeerida. See näitab, et purskkaevu koodi kasutav kodeerimisprotsess on äärmiselt tugev, ütles meeskond.

Kallim protseduur

Teadlased näitasid ka, et oma meetodiga saavad nad teavet mitte ainult turvaliselt, vaid ka suurtes kogustes tõhusalt. Seega piisab ühest grammist DNA-st 215 petabaiti andmete hoidmiseks. Ainus salvestusprotsessi saak: maksumus. Ainuüksi 7000 dollarit maksis biomolekulide süntees. Teadlased kulutasid oma andmete lugemiseks veel 2000 dollarit. (Teadus, 2017; doi: 10.1126 / teadus.aaj2038)

(Columbia ülikooli tehnika- ja rakendusteaduste kool, 06.03.2017 - DAL)