我們?nèi)梭w的所有信息都由 DNA 編碼組成。你可曾想過,DNA 能夠像 U 盤一樣存儲(chǔ)信息?美國《科學(xué)》雜志近日發(fā)布的一項(xiàng)研究顯示,一克 DNA 的儲(chǔ)存容量相當(dāng)于約 20 萬臺(tái)電腦!具體容量約為 200 PB(20 萬兆)。這是因?yàn)?DNA 具有密度大、穩(wěn)固耐用的特點(diǎn)。專家指出,當(dāng)今時(shí)代信息爆炸,只要解決了成本問題,那么 DNA 儲(chǔ)存技術(shù)的市場(chǎng)空間將無可限量。
DNA 存儲(chǔ)技術(shù):并非首創(chuàng)
其實(shí) DNA 儲(chǔ)存技術(shù)早已有人在做了。2012 年,哈佛大學(xué)研究人員用 DNA 儲(chǔ)存了一本五萬字的圖書。歐洲生物信息研究所(European Bioinformatics Institute )也在 DNA 儲(chǔ)存了莎士比亞的十四行詩以及馬丁?路德?金的演講《我有一個(gè)夢(mèng)想》的錄音帶。
突破性進(jìn)展:存儲(chǔ)效率大幅提升
盡管不是首創(chuàng),但是,這項(xiàng) DNA 存儲(chǔ)技術(shù)目前迎來了重大突破。研究員 Erlich 是該研究報(bào)告的作者之一,他表示:這是因?yàn)檫\(yùn)用了一種編碼技術(shù),能讓 DNA 存儲(chǔ)效率提升 60%,還能有效減小 DNA 存儲(chǔ)過程中的出錯(cuò)率。他在美國哥倫比亞大學(xué)擔(dān)任計(jì)算機(jī)科學(xué)系教授,同時(shí)也是紐約基因組中心(New York Genome Center)的核心成員。
把數(shù)據(jù)輸入 DNA 只需要不到一秒鐘。DNA 說白了只不過是四種核苷酸(nucleotides)排列組合的結(jié)果。我們只需要把這些核苷酸和數(shù)據(jù)一一對(duì)應(yīng)。”研究員 Erlich 說,一旦掌握了編碼方法,或者找到了符合編排或數(shù)據(jù)輸入要求的 DNA,那接下來的工作就很輕松了。這是因?yàn)?,可以由企業(yè)來負(fù)責(zé) DNA 的實(shí)際制造過程。
獨(dú)特魅力“這么做,是為了激發(fā)人們的想象力嗎?沒錯(cuò)!就是想讓人們感受到科學(xué)有趣的一面!”DNA 具有密度大、穩(wěn)定性高的優(yōu)勢(shì),因此 DNA 儲(chǔ)存技術(shù)仍然比新興的同類技術(shù)更讓科學(xué)家著迷。研究員 Kosuri 說:“DNA 儲(chǔ)存技術(shù)所涉及的難度,相當(dāng)于把單個(gè)原子放在一個(gè)物體表面?!?他指的是 IBM 公司,該公司曾在 1989 成功用 35 個(gè)氙原子拼出了“IBM”的字樣。
他說:“排列原子也不是不可能的事,但必須要運(yùn)用極高的成像技術(shù),在接近于零度的真空狀態(tài)下才能完成。這就涉及到核心技術(shù)了。相比之下,我們的 DNA 技術(shù)要比它更實(shí)用,雖然在存儲(chǔ)方面肯定沒有軟盤或 U 盤那么實(shí)用。”
DNA 還可以儲(chǔ)存 3D 影像。雖然全息存儲(chǔ)(holography memory)和賽道儲(chǔ)存(racetrack memory )技術(shù)也可以做到,但是研究員 Kosuri 說,DNA 技術(shù)能儲(chǔ)存的密度比它們要高得多。
克服技術(shù)難點(diǎn)
但是,DNA 的合成過程是非常艱辛的。研究員 Kosuri 表示:“難就難在,DNA 合成過程中,約有 5% 的時(shí)間,會(huì)損失掉隨機(jī)合成的一個(gè) DNA。而且,不僅合成困難,就連讀取 DNA 也是一個(gè)問題。如果有一種編碼技術(shù)能夠避免這種損失,那么 DNA 存儲(chǔ)技術(shù)就會(huì)變得簡(jiǎn)單得多,也利索得多?!?
美國《科學(xué)》雜志發(fā)布的這項(xiàng)研究,的確實(shí)現(xiàn)了這種編碼技術(shù)。研究員 Kosuri 表示,這項(xiàng)技術(shù)可以讓 DNA 合成過程中出現(xiàn)的失誤容易讓人接受。這要?dú)w功于一種特殊的編碼技術(shù),而用這項(xiàng)技術(shù)傳送數(shù)字信息,通常能夠適應(yīng)連接中斷的情況發(fā)生,比如在智能手機(jī)上播放 Youtube 視頻。Erlich 表示,這就意味著,這種編碼技術(shù)能夠處理那些比研究中使用的 DNA 質(zhì)量低得多的 DNA。
研究員 Kosuri 沒有參與該項(xiàng)研究,但他是上述 2012 年哈佛大學(xué)研究報(bào)告的作者,如今是加利福尼亞大學(xué)洛杉磯分校(UCLA)的一名生物化學(xué)教授。
蘇黎世聯(lián)邦理工學(xué)院化學(xué)工程師 Grass 也參與了這項(xiàng)研究,他表示,研究團(tuán)隊(duì)成功地在 DNA 中存儲(chǔ)并且恢復(fù)了一個(gè)操作系統(tǒng),是個(gè)“優(yōu)雅的成就”。他還說:“我每天都在‘使用’DNA,所以我明白這項(xiàng)工程必須要萬無一失?!?Erlich 表示,他們是故意把那個(gè)操作系統(tǒng)放進(jìn) DNA 的?!比绻话盐募昝赖鼗謴?fù),那么就可能會(huì)損毀某些內(nèi)容。但我們就是要證明我們不怕把這種可能會(huì)損毀的內(nèi)容放進(jìn) DNA。”
Kosuri 也同意這種方法十分高效:“我認(rèn)為他們采用了正確的實(shí)驗(yàn)測(cè)試算法。他們選對(duì)了算法,而且看起來很奏效?!?
成本巨大
在化學(xué)工程師 Grass 看來,合成 DNA 的成本比編排 DNA 的成本還要大。他說:“雖然編排 DNA 的成本太高,無法實(shí)際應(yīng)用,不過現(xiàn)在有了納米微孔 (nanopore) 插入計(jì)算機(jī)進(jìn)行 DNA 編排的技術(shù),所以它的成本越來越小了。但是,合成 DNA 的成本仍然十分之高?!?/p>
研究員 Kosuri 也表示:“DNA 儲(chǔ)存技術(shù)規(guī)?;瘧?yīng)用的阻礙就是,它的成本實(shí)在是太高了。關(guān)于編碼、編碼的工作方式以及這種編碼是否可靠等種種問題,我們的研究報(bào)告都一一解答了。但是,唯獨(dú)成本問題,是我們目前解決不了的。”
Grass 認(rèn)為,要想讓 DNA 能夠儲(chǔ)存信息長達(dá)數(shù)百年之久,就必須要采用另外一些手段把 DNA 固定住。他解釋道,基因物質(zhì)可以在動(dòng)物骨頭和動(dòng)植物化石中固定保存,但是自由 DNA 卻不一樣,具有不穩(wěn)定性。如果把它放在實(shí)驗(yàn)室,一年以后里面的信息就會(huì)開始損毀了。
前景:依然明朗
研究員 Kosuri 已經(jīng)不再從事 DNA 儲(chǔ)存技術(shù)研究,但是他本人對(duì)這項(xiàng)技術(shù)的發(fā)展還是持樂觀態(tài)度。他說:“上百萬倍的成本聽起來很嚇人,但是在過去的 15 年,我們已經(jīng)把成本縮小為原來的上百萬分之一了?,F(xiàn)在,不僅僅是編排 DNA,就連合成 DNA 的成本也已經(jīng)有所下降?!?
研究員 Erlich 憧憬在未來,有人可以發(fā)明一種“專門用于 DNA 存儲(chǔ)的工序,方便我們快速合成劣質(zhì) DNA”,從而減少成本。他說:“我們可以質(zhì)量參差不齊的 DNA 先提取出來,然后再根據(jù)編碼方式來逐步對(duì)其進(jìn)行糾正。這是我們未來的研究方向”
目前的研究是一個(gè)良好的開端。研究員已經(jīng)在 DNA 存儲(chǔ)了許多內(nèi)容,它們能靈敏地減少存儲(chǔ)錯(cuò)誤,其中包括:一個(gè)操作系統(tǒng)、一個(gè)電腦病毒、一張價(jià)值 50 美元的亞馬遜禮品購物卡、1895 年于法國上映的世界上部電影《火車到站》(Arrival of a train at La Ciotat)、航天飛行器“先驅(qū)者”(Pionner)的一塊載有人類訊息的鍍金鋁板以及美國數(shù)學(xué)家、信息論的創(chuàng)始人克勞德?艾爾伍德?香農(nóng)(Claude Elwood Shannon)于 1948 年發(fā)表的一篇研究報(bào)告。
研究員 Erlich 說:“有人問我,‘你怎么能夠把視頻存進(jìn) DNA 呢?’ 這也是我要向我 6 歲小兒子解釋的問題?!?/p>