您的当前位置:首页>科技快讯 > 正文

科学家提出DNA信息存储阴阳双编码新方法 为DNA存储多类型应用提供重要工具

  • 2022-05-07 14:44:19 来源:cnBeta.COM

日,深圳华大生命科学研究院研究员沈玥团队与合作者在《自然计算科学》上发表了封面文章,为DNA信息存储的应用提供了一种高密度、高稳定的比特-碱基编解码方法,并完成了体内外两种模式的信息存储实验验证。

DNA存储作为生物技术与信息技术相融合的主要方向之一,年来受到广泛关注。DNA存储的编解码,即比特与碱基之间的转换,是DNA存储中最重要的环节之一,不仅决定信息转换的效率(信息密度),还直接影响存储信息的稳定及可靠恢复。从2012年起,编解码技术的发展主要聚焦于提升信息密度,而技术兼容和原始信息的稳定恢复方面的考虑尚不全面。2017年以前,编解码技术都未能实现完全的技术兼容,产生序列的GC含量很大程度上还是依赖于原始数据的0/1分布情况。2017年,美国哥伦比亚大学研究团队开发的DNA喷泉码几乎解决了这一问题,但直接套用的信道编码技术有较强的数据类型偏好,因此在实际的存储应用中存在较高的数据无法恢复风险的问题。

该论文的通讯作者沈玥告诉《中国科学报》,为解决这一问题,他们将从DNA双链模型中受到的启发,与中华文化中“阴阳”对立统一的思想相结合,巧妙地应用于DNA编解码系统,以两套不同的规则,分别对两条二进制信息进行“一对一”编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列;另一方面,通过引入筛选机制,他们将与现有合成测序技术兼容不佳的序列通过预先设置的筛选条件进行过滤。根据不同的组合方法,该系统共能提供1536种不同的编码规则组合,大大扩展了其应用场景范围。

研究人员还通过编码学的理论推导以及不同数据类型文件的模拟编码,证明了该系统在保证信息密度的前提下,在数据恢复稳定方面体现显著的能提升(存储数据的均恢复率较DNA喷泉码现有水提升两个数量级)。

该论文的共同第一作者、深圳华大生命科学研究院助理研究员质告诉记者,年来用细胞进行DNA信息存储也受到了极大关注,为此,他们还测试了该系统在酵母细胞内存储、传代后的数据恢复稳定。结果证明,作为载体的酵母菌株经过1000代以上的传代,信息仍可以被完整恢复,该存储方式接天然DNA分子存储物理信息密度的理论极限,每克DNA能存储的信息量约为 432.2EB。

该研究开发了一种全新的DNA存储编码方法,并提出1536种不同编码规则组合的方案,为DNA存储的多类型应用提供了重要工具,有望在海量数据长期存储的新型介质研究中起到积极的推动作用。

标签: 实验验证 信息技术 主要方向 广泛关注

推荐阅读

科学家提出DNA信息存储阴阳双编码新方法 为DNA存储多类型应用提供重要工具

近日,深圳华大生命科学研究院研究员沈玥团队与合作者在《自然计算科学》上发表了封面文章,为DNA信息存...

中国成年人乳制品摄入量与癌症风险相关 经常食用乳制品者总体发病风险提高9%

来自中国医学科学院、北京大学和英国牛津大学的研究人员对50余万人平均随访近11年的研究显示,在中国成...

PNNL科学家利用磁性纳米粒子从水中提取金属 可从各种水源提取重要矿物

几个世纪前,炼金术士们试图将铅转化为金。虽然他们没有成功,但从丰富的资源中提取珍贵资源的概念仍然...

3D体外模型揭开人类脊柱起源 脊柱发育缺陷会导致罕见遗传性疾病

脊柱是所有脊椎动物骨骼的中心支撑结构,不仅为肌肉提供附着场所,还保护脊髓和神经根。脊柱发育缺陷会...

国际首个肉牛高质量组织基因表达图谱问世 组织涵盖广、分辨率高及可参照性强

近日,中国农业科学院北京畜牧兽医研究所牛遗传育种科技创新团队成功构建了国际首个肉牛高质量组织基因...

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

业界