DNA存儲(chǔ)是由DNA高通量合成與測(cè)序技術(shù)催生的信息與生物相融合的新領(lǐng)域,通過(guò)DNA分子的堿基序列直接編碼數(shù)字信息,由高通量合成技術(shù)合成序列進(jìn)行信息寫(xiě)入,并利用高通量測(cè)序技術(shù)實(shí)現(xiàn)信息的讀取,以實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)的信息還原。DNA存儲(chǔ)的編解碼,是DNA存儲(chǔ)中最重要的環(huán)節(jié)之一,直接影響了存儲(chǔ)信息的穩(wěn)定性及可靠恢復(fù)性。直接套用的信道編碼技術(shù)有較強(qiáng)的數(shù)據(jù)類(lèi)型偏好性,因此在實(shí)際的存儲(chǔ)應(yīng)用中存在較高的數(shù)據(jù)無(wú)法恢復(fù)的風(fēng)險(xiǎn)。
近日,深圳華大生命科學(xué)研究院研究團(tuán)隊(duì)在《Nature Computational Science》上發(fā)表了題為“Towards Practical and Robust DNA-based Data Archiving Using ‘Yin-Yang Codec’ System”的研究論文,提出了一套DNA信息存儲(chǔ)專(zhuān)用的比特-堿基編解碼系統(tǒng)。
研究團(tuán)隊(duì)從DNA雙鏈模型中受到啟發(fā),結(jié)合中華文化中“陰陽(yáng)”對(duì)立統(tǒng)一的思想,將其巧妙應(yīng)用到DNA編解碼系統(tǒng)當(dāng)中,以兩套不同的規(guī)則,分別對(duì)兩條二進(jìn)制信息進(jìn)行“一對(duì)一”編譯轉(zhuǎn)換,再取兩者統(tǒng)一交集的部分為最終解,實(shí)現(xiàn)將兩條獨(dú)立的信息組合統(tǒng)一為一串DNA序列。同時(shí)引入篩選機(jī)制,將與現(xiàn)有合成測(cè)序技術(shù)兼容性不佳的序列通過(guò)預(yù)先設(shè)置的篩選條件進(jìn)行過(guò)濾。研究通過(guò)編碼學(xué)的理論推導(dǎo)以及不同數(shù)據(jù)類(lèi)型文件的模擬編碼與實(shí)驗(yàn)驗(yàn)證,證明了該系統(tǒng)在保證信息密度的前提下,在數(shù)據(jù)恢復(fù)穩(wěn)定性與存儲(chǔ)密度方面體現(xiàn)顯著的性能提升,每克DNA能存儲(chǔ)的信息量約為 432.2 EB。
該研究為DNA信息存儲(chǔ)的應(yīng)用提供了一種高密度、高穩(wěn)定性的比特-堿基編解碼方法,并完成了體內(nèi)外兩種模式的信息存儲(chǔ)實(shí)驗(yàn)驗(yàn)證;研究開(kāi)發(fā)了一種全新的DNA存儲(chǔ)編碼方法,為DNA存儲(chǔ)的多類(lèi)型應(yīng)用提供了重要工具,有望在海量數(shù)據(jù)長(zhǎng)期存儲(chǔ)的新型介質(zhì)研究中起到積極的推動(dòng)作用。
論文鏈接:
https://www.nature.com/articles/s43588-022-00231-2
注:此研究成果摘自《Nature Computational Science》雜志,文章內(nèi)容不代表本網(wǎng)站觀點(diǎn)和立場(chǎng),僅供參考。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,宣傳國(guó)家科技政策,展示國(guó)家科技形象,增強(qiáng)國(guó)家科技軟實(shí)力,參與國(guó)際科技輿論競(jìng)爭(zhēng),提高國(guó)際科技話語(yǔ)權(quán),并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本網(wǎng)文章及圖片侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。