中國教育在線
中國教育在線
用1公斤DNA裝下全世界?北大團隊又發(fā)Nature!
2024-10-28 15:50:00
北京大學(xué)
作者:

龜甲、宣紙、磁帶、硬盤……

數(shù)據(jù)怎么存、存在哪

始終是人們孜孜以求的問題

時代變遷,社會發(fā)展

我們的生活每天都在產(chǎn)生海量數(shù)據(jù)

傳統(tǒng)硅基材料

難以滿足日益增長的數(shù)據(jù)存儲需求

北京大學(xué)張成、錢瓏團隊

與合作者另辟蹊徑

以表觀修飾作為存儲介質(zhì)

通過分子信息并行寫入實現(xiàn)信息存儲

為這道難題提出新的解法

10月23日

團隊研究成果已發(fā)表于Nature

△研究成果已正式發(fā)表于Nature

1公斤便可“裝下”全世界

  2024年10月23日,北京大學(xué)計算機學(xué)院張成與定量生物學(xué)中心錢瓏聯(lián)合研究團隊與合作者,在國際學(xué)術(shù)期刊Nature上發(fā)表題為“Parallel molecular data storage by printing epigenetic bits on DNA”的研究論文,首次提出了一種基于并行寫入策略的DNA存儲策略,成功將信息打印在DNA分子之上,猶如“活字印刷”,在白紙上批量印刷信息。團隊在實驗中,成功將中國漢代“白虎”瓦當(dāng)和大熊貓的高清圖片(數(shù)據(jù)量超過27.5萬比特)寫入DNA分子中,并無損還原了原始數(shù)據(jù),解析出高清圖片。

  DNA具有超高存儲密度,僅1克DNA就足以存儲1000萬小時高清視頻數(shù)據(jù);1公斤DNA,便可以裝下全世界數(shù)據(jù)。此外,如果避免潮濕和紫外線照射,DNA可以保存數(shù)十萬年之久,擁有超長壽命。相比之下,硬盤往往需要每隔幾年更換一次以防止數(shù)據(jù)損壞。因此,DNA顯示出作為顛覆性存儲介質(zhì)的巨大潛力。

  然而,傳統(tǒng)DNA存儲依賴“從頭合成”的信息寫入路線,在成本和速度上面臨著“速度慢”“易出錯”“價格貴”的多重巨大挑戰(zhàn)。不同于傳統(tǒng)技術(shù)路線,張成-錢瓏聯(lián)合團隊開發(fā)的“表觀比特(epi-bit)”DNA存儲技術(shù),利用預(yù)制的DNA模板和“分子活字塊”,通過DNA自組裝介導(dǎo)的分子信息排版,經(jīng)選擇性酶促甲基修飾轉(zhuǎn)移,實現(xiàn)了“活字印刷”,達到分子級“信息打印”的目的。

  該技術(shù)不依賴于主流的“從頭合成”寫入路線原理,通過DNA自組裝與選擇性酶促甲基化(DNA分子的一種表觀遺傳修飾)的組合原理,無需合成,就像在紙上印刷文字。首先,研究團隊設(shè)計并預(yù)制通用的單鏈DNA載體和互補短單鏈DNA“文字庫”。然后,通過將“文字庫”裝到DNA載體的相同加載序列上,任意表觀比特信息就得以被排版。接下來,堿基修飾(5-甲基胞嘧啶)通過酶的選擇性甲基化以并行的方式穩(wěn)定地“打印”在DNA載體上,一場精密、高效的“分子印刷術(shù)”就大功告成了。

  這種被稱為“表觀比特”類似于傳統(tǒng)的比特,以兩個二進制數(shù)值中的一個(0或1)來存儲信息,對應(yīng)堿基是否甲基化。研究團隊通過使用有限的700種DNA活字和5個模板進行編程,在自動平臺上實現(xiàn)了約27.5萬個比特的免合成寫入,每個反應(yīng)的寫入輸出為350比特,遠超過去依賴DNA從頭合成的數(shù)據(jù)存儲系統(tǒng)每個反應(yīng)約僅1比特的輸出量,實現(xiàn)了重大突破。

  同時,這一研究還成功實現(xiàn)了個人定制DNA存儲示例,證明了便捷的分布式DNA存儲應(yīng)用潛力。該方法的建立,不僅為實現(xiàn)了快速、低成本的大規(guī)模分子數(shù)據(jù)存儲奠定了技術(shù)基礎(chǔ),還為未來DNA存儲的發(fā)展提供了全新思路。

基于表觀比特條碼的高位并行大規(guī)模存儲示意

  “這項技術(shù)的核心突破在于,我們能夠通過預(yù)制的DNA模板和活字塊,在分子底層以排版的方式打印epi-bit信息,實現(xiàn)分子數(shù)據(jù)的精確并行寫入,進而完成大規(guī)模并行DNA存儲?!闭撐耐ㄓ嵶髡?、北京大學(xué)研究員張成介紹說,“與傳統(tǒng)DNA數(shù)據(jù)存儲方法相比,這種活字印刷并行寫入方式僅需有限數(shù)量的預(yù)制DNA分子,從而避免了復(fù)雜繁瑣DNA序列編碼過程,不僅大幅降低分子信息寫入復(fù)雜度,還能降低成本,提高操控靈活性?!?/p>

把照片“存在”DNA里

  團隊在實驗中,將中國漢代“白虎”瓦當(dāng)和國寶大熊貓“飛云”的高清圖片成功寫入DNA分子中,數(shù)據(jù)量超過27.5萬比特,相比此前發(fā)表的其他非傳統(tǒng)DNA存儲技術(shù),數(shù)據(jù)規(guī)模提升超過300倍。這些信息讀取使用便攜式納米孔測序儀,實現(xiàn)了對DNA模板上復(fù)雜表觀比特信息的高通量讀取,并通過單次超240種不同修飾模式的并行解析,無損還原了原始數(shù)據(jù),解析出高清圖片,真正有望實現(xiàn)“經(jīng)典永流傳”。實驗結(jié)果驗證了該創(chuàng)新型分子存儲技術(shù)的可行性和準確性,還展示了表觀比特的穩(wěn)定性。

  值得關(guān)注的是,團隊還展示了這項技術(shù)的分布式存儲應(yīng)用潛力。在個人定制DNA存儲實驗中,邀請了北京大學(xué)、華北電力大學(xué)等單位60名背景廣泛的青年志愿者,由他們在日常環(huán)境下,將私人數(shù)據(jù)親手寫入DNA并由個人保存。這些數(shù)據(jù)直到使用時才被讀取,可有效保障個人數(shù)據(jù)的隱私與安全。這種分布式DNA存儲方式,不僅能極大降低DNA存儲的使用門檻,且保障了數(shù)據(jù)隱私,有望推動DNA存儲的個人應(yīng)用。

表觀比特DNA存儲原理流程和實驗結(jié)果

  從二進制數(shù)據(jù)到DNA數(shù)據(jù),從從頭合成到并行寫入,從DNA存儲池到細胞存儲,從二代測序到納米孔測序……在多維技術(shù)的突破性革命與融會貫通下,誕生了如今的表觀比特DNA存儲框架,這一框架為大規(guī)模數(shù)據(jù)存儲提供了全新的解決方案,有望突破DNA存儲的成本和速度壁壘。此項技術(shù)的開發(fā),還展現(xiàn)了非傳統(tǒng)分子比特在數(shù)據(jù)存儲中的獨特優(yōu)勢,為未來新型分子信息處理系統(tǒng)的研發(fā)奠定了堅實的基礎(chǔ)。

  “在DNA這張白紙上批量打印信息,代表著DNA存儲技術(shù)的重要突破與革新?!闭撐耐ㄓ嵶髡?、北京大學(xué)研究員錢瓏表示,“可預(yù)見的是,在未來,無論身處何時何地,我們都將無需依賴大型實驗儀器,就能實現(xiàn)簡單、準確、高效的DNA數(shù)據(jù)存儲。”

免責(zé)聲明:

① 凡本站注明“稿件來源:中國教育在線”的所有文字、圖片和音視頻稿件,版權(quán)均屬本網(wǎng)所有,任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本站協(xié)議授權(quán)的媒體、網(wǎng)站,在下載使用時必須注明“稿件來源:中國教育在線”,違者本站將依法追究責(zé)任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉(zhuǎn)載稿,本站轉(zhuǎn)載出于非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性。如轉(zhuǎn)載稿涉及版權(quán)等問題,請作者在兩周內(nèi)速來電或來函聯(lián)系。

相關(guān)新聞