一个跨学科研究人员小组发现了一种新技术,可以以前所未有的准确性和效率在DNA信息中存储这种情况,在本例中为“绿野仙踪”,译为世界语。该技术利用DNA交链的信息存储能力,以持久且紧凑的方式编码和检索信息。
该技术在本周《美国科学院院刊》上的一篇论文中进行了描述。
这项研究的作者之一,分子生物学副教授伊利亚·芬克尔斯坦(Ilya Finkelstein)表示:“关键的突破是一种编码算法,即使在存储过程中DNA链部分受损时,也可以准确地检索信息。”
人类正在以比过去高得多的速度创建信息,这促使人们需要一种有效地存储更多信息并且持续时间长的方式。诸如Google和Microsoft之类的公司正在探索使用DNA存储信息的公司。
与Finkelstein合作进行这项研究的研究科学家斯蒂芬·琼斯(Stephen Jones)说:“我们需要一种存储这些数据的方法,以便可以随时随地以可读的格式获得这些数据。”Bill Press,计算机科学与整合生物学联合任命的教授;和博士学位校友约翰·霍金斯(John Hawkins)。“这个想法利用了数十亿年来生物学的优势:将大量信息存储在一个很小的空间中,可以持续很长时间。DNA不会占用太多空间,可以在室温下存储它,可以持续数十万年。”
DNA的效率是当前存储方法的500万倍。换句话说,一滴DNA可以存储与两个装有数据服务器的沃尔玛相同数量的信息。而且,DNA不需要永久性的冷却和容易发生机械故障的硬盘。
只有一个问题:DNA容易出错。当遗传密码有错误时,它与计算机密码有错误时有很大不同。计算机代码中的错误往往显示为代码中的空白点。DNA序列中的错误显示为插入或缺失。问题在于,当DNA中删除或添加某些东西时,整个序列会移动,而没有空白点可以提醒任何人。
以前,当信息存储在DNA中时,需要保存的信息片段(例如小说中的一段)将重复10到15次。读取信息后,将对重复进行比较以消除任何插入或删除。
琼斯说:“我们找到了一种更像网格的方式来构建信息的方法。”“每条信息都会增强其他信息。这样一来,它只需读取一次即可。”
研究人员开发的语言还避免了容易出错或难以阅读的DNA部分。语言的参数也可以随所存储信息的类型而变化。例如,在一本小说中丢掉单词并不像在纳税申报表中丢掉零一样大。
为了演示如何从降解的DNA中检索信息,研究小组将其“绿野仙踪”代码置于高温和极端潮湿的环境中。即使这些恶劣条件损坏了DNA链,所有信息仍然可以成功解码。
霍金斯说:“我们试图同时解决该过程中的所有问题,”霍金斯最近在UT的奥登大学计算工程与科学学院任职。“最终我们取得了非凡的成就。”