新闻与分析 需要一些额外的存储空间吗? 尝试dna

需要一些额外的存储空间吗? 尝试dna

目录:

视频: É или È? Как правильно ставить диакритические знаки над E во французском. Accent aigu и accent grave (九月 2024)

视频: É или È? Как правильно ставить диакритические знаки над E во французском. Accent aigu и accent grave (九月 2024)
Anonim

数十年来,工程师已经成功地将更多的存储空间推向较小的空间,但这不可能永远持续下去。 数据存储的下一个飞跃可能是所有有机物质中的DNA形式:全国实验室的科学家正在试验合成DNA作为存储介质。

计算机科学副教授路易斯·汉里克·塞兹(Luis Henrique Ceze)表示:“如果您关注电子技术的发展方向,硅技术以及当今我们用来构建计算机的许多基本技术,那么我们几乎都在接近极限。”和华盛顿大学的工程系。 “ DNA非常密集,非常耐用,维护所需的电力很少,因此使用DNA进行数据存储有很多优势。”

Ceze一直与Microsoft Research的计算机体系结构研究员Karin Strauss合作,在这两个机构之间建立了合作关系-该项目将计算机科学与生物学联系在一起。 由大约20人组成的团队,大学提供分子生物学家,微软提供计算机科学家。

要了解如何将DNA用于存储,请考虑所有计算机数据都是二进制或2基。 DNA是由腺嘌呤,胞嘧啶,鸟嘌呤和胸腺嘧啶(缩写为A,C,G和T)组成的base-4。 第一步是将base-2信息转换为base-4,因此A对应于00,C对应于01,G对应于10,T对应于11(这简化了一点,但没有涉及)。

然后,科学家使用一种称为DNA合成器的机器以正确的顺序组合四种化学物质。 结果将信息存储为比铅笔尖端小的盐状簇的许多倍。 读回该信息需要DNA测序仪。

尽管这听起来很脆弱(例如当门突然打开时可能会吹掉的东西),但DNA是我们所见过的最强大的数据存储介质。 科学家已经成功读取了数十万年前的DNA。

对DNA进行测序需要除去一小部分存储的物质,并且该过程会耗尽该样品。 因此,DNA记录可以读取有限次。 不过,这不是问题,因为存储的材料具有如此多的冗余数据。 可以反复采样。 当今的存储介质在发生故障之前还具有有限的写入和读取周期,因此这并不是什么新鲜事物。

正如Ceze指出的那样,DNA永远不会过时。 尽管我们许多人在抽屉后面都放有无法读取的软盘,但这并不是DNA的命运。 塞兹说:“出于生命科学和健康原因,我们将始终关心DNA,因此您将始终具有读取存储在DNA中的信息的方式。”

2016年7月,微软和华盛顿大学成功地将200MB数据编码为DNA形式,打破了之前的22MB记录。 Strauss说,使用DNA,将有可能在1英寸的多维数据集中存储1 EB的数据,即10亿GB。

Strauss说:“我们估算了特定容量中可以放入多少数据。” “如果我们今天决定存档整个可访问的Internet,这意味着我们要估算出多少容量,这意味着不包含密码或任何种类的电子墙的所有内容,然后我们想到了一个大型鞋盒的大小。”

这听起来像是一个遥不可及的提议,但塞兹认为,十年之内,我们将在市场上看到商用DNA存储系统。 它们不会像微处理器存储那样工作,因为DNA需要在潮湿的化学环境中进行创建,但是它们将以企业磁带系统现在提供的相同速度提供巨大的容量和随机访问。

快速发展的领域

DNA已经存在了数十亿年,但是DNA作为一种可用的存储技术的示范始于1986年,当时麻省理工学院的研究员Joe Davis将一个简单的二进制图像编码为28个碱基对的DNA。

该领域的另一位先驱者是乔治·丘奇(George Church),他是遗传学教授,自1977年以来一直在哈佛医学院工作,自1986年以来一直经营自己的实验室。丘奇自1970年代以来一直对降低DNA读写成本感兴趣,他相信有一天他们将一起创建实用的数据存储。 他开始对2000年左右的DNA研究感兴趣,并于2003年和2004年进行了重要的测序和合成测试。到2012年,他能够将这两个领域放在一起并创建了一个用于编码数据的系统。 他在2012年“ 科学”杂志上 有影响力的文章中写下了这项工作。

丘奇解释说:“在2003年和04年之前,测序和合成基本上是在毛细管(或小试管)中完成的,在这些毛细管或小试管中,每个序列只有一根试管。” “这是完全手动的,并且不具有可伸缩性。我们从微细加工半导体行业吸取的教训是,您需要提出一种将其本质上置于二维平面然后缩小特征尺寸的方法。基于列的方法与此兼容,因此在2003年,我们展示了如何在二维平面上分布序列,然后使用荧光成像对它们进行成像,而荧光成像是目前测序的主要方式。然后在2004年,我们发现您可以在飞机上制造DNA,然后将其滑下来,然后它甚至可以变得更紧凑;因此飞机只是一个合成它们的临时场所,然后您可以将它们压制成一个数百万次的三维物体比普通数据存储更紧凑。

“这些是2003年和2004年进行概念验证的证明。在2012年,我们和其他人改进了DNA的读写方法,我将它们整合到一个实验中,我编写了一本我刚刚写成DNA的书,包括图像,表明基本上任何数字内容都可以用DNA编码。”

尽管成本是DNA储存的重要障碍,但Church指出,在完成研究的短时间内,价格已急剧下跌。 读取DNA的成本提高了约300万倍,而写入的成本却提高了10亿倍。 他可以看到,在更短的时间内,两者都可以再提高一百万倍。 他还指出,复制DNA材料的成本几乎是免费的,长期存储成本也是如此。 对于档案存储而言,读取数据的成本并不是很大的障碍,因为从未读取大量已归档的资料,并且有选择地读取了某些项目。 他建议,看一下整个系统的成本。 传统的存储方法以摩尔定律的速度发展,并将很快达到稳定状态。 但是DNA存储技术的发展速度超过了摩尔定律,并且没有任何平稳的迹象。

教会认为首先要采用DNA数据存储是档案和云存储。 他指出,包括IBM,微软和Technicolor在内的公司都有自己的研发团队来研究这一领域。 他在2015年与Technicolor合作存储了 《旅行到月球》 ( A Trip to the Moon) ,这是一部经典的1902年电影,曾经被认为迷失了DNA。 现在,Technicolor具有许多DNA副本,这些副本的总和不超过一小撮灰尘。

丘奇有一个由93个人组成的实验室,致力于DNA的存储,目前专注于两个目标。 首先是从根本上提高每个循环的速度。 信息存储在数百个层中,每个层与一个分子一样厚。 每次添加当前需要三分钟,但是Church认为可以将其降低到不到一毫秒。 他指出,这要快20万倍,这意味着从有机化学到生物化学的转变。 他还想改变用于阅读和书写的工具的制造方式,以使其更小。 目前,它们的大小相当于大型冰箱。 他希望缩小比例。

内置冗余和纠错需求

受Church的2012年《 科学》 文章影响的一位研究员是厄巴纳-香槟分校伊利诺伊大学的Olgica Milenkovic教授。 文章提到需要编码,这立即引起了她的兴趣。 存储研究中的编码是一种为数据添加冗余的技术,该冗余以后可用于纠正读写过程中发生的错误。 有关为何如此重要的示例,请参见此处的两张《公民凯恩》图片。 两者均由Milenkovic的团队以DNA编码,然后阅读。 猜猜哪个使用了冗余。

您是正确的:左侧图像是冗余编码的,而右侧图像则不是冗余的。

添加冗余的一种简单方法是将每个字符重复设定的次数。 与其写0,不如写4次。 那是蛮力方法,简单但效率极低。 Milenkovic的工作是以更复杂的方式实现相同的错误纠正。 它涉及称为奇偶校验或线性一致性校验的技术,以提供验证数据的方法。

Milenkovic说:“整个领域基本上是帮助您纠正出现的错误,甚至更好地避免您知道很可能出现的错误。” “我们引入受控冗余来消除错误,并且受控冗余不是简单重复的形式,因为这是非常无效的。”

这就是Milenkovic进入该领域的原因,但是她现在的研究是降低DNA合成的巨大成本。

“我的学生H. Tabatabae Yazdi对此主题非常活跃,我一直在努力寻找一种避免合成DNA的聪明方法。由于成本高昂,合成DNA绝对是该技术的瓶颈。 ”,Milenkovic说。

尽管Milenkovic乐于透露太多未发表的研究成果,但她的解决方案涉及“狡猾的数学方法”,并且全都与时间有关,其中信息间隔的大小是有意义的。

“如果您不希望使用ATGC在特定位置真正对二进制符号进行编码的形式,则可以提出更智能,更有效的信息存储方式,因为您不需要一遍又一遍地合成链再次,” Milenkovic解释道。 “您可以通过某种方式一次合成它们,然后以智能的组合方式重复使用合成的DNA。”

Milenkovic希望通过她的工作将合成DNA的成本降低至少三个数量级。 她指出,这还不够,但这是进步。 这也有助于她发现令人着迷的一系列研究。

Milenkovic说:“说实话,扮演上帝并用DNA编码您自己的信息非常令人兴奋。” “这使一个人兴奋地知道您正在与选定的自然分子一起玩耍,并使其按照您想要的方式存储,编码并向未来传达信息。”

兑现-现在每天

并非所有具有DNA储存功能的干粉尘学术研究。 总部位于爱尔兰的Helixworks公司正试图从中获利。 它在亚马逊上有一种产品。

“我们在亚马逊上启动,因此您可以获得512KB编码为DNA的数字数据,”该公司的联合创始人Nimesh Pinnamaneni解释说。 “这是很小的东西。也许是照片或诗歌,诸如此类。”

这是不寻常的购买,但对于拥有一切的人而言,这可能是完美的爱情象征,尤其是如果该人是科学家:

皮纳曼尼尼回忆说:“我记得有一位顾客打电话给我们。他想给妻子做礼物-他们俩都是生物技术专家–他想在结婚周年纪念日给妻子做礼物。他想在DNA中传达信息,并给她DNA礼物。” “她必须对DNA进行测序才能阅读信息。这是一种传递爱情信息的相当复杂的方法,但是对于生物技术专家来说,这也许很可爱,你知道吗?”

但是Helixworks在2016年8月在准备履行订单之前将其产品发布到亚马逊上有点领先。 在Helixworks被迫将其产品退市之前,有两个人购买了该公司售价199美元的DNADrive(14克拉金质胶囊,里面装有DNA簇)。 DNADrive仍在亚马逊上,但不是可购买的。

这并不意味着Helixworks已经结束,只是过分渴望。 现在停止已经太遥远了。 该公司始于瑞典的Borås大学,该公司的另一位联合创始人Pinnamaneni(左图)和Sachin Chalapati(右)在这里获得了生物技术硕士学位。 他们为DNA储存研究筹集了资金,回到印度班加罗尔后继续工作,并开发了概念证明。

大量资金的投入使他们进入了由加利福尼亚州旧金山的一家初创风险投资公司SOSV运营的IndieBio加速器计划。 Helixworks被该计划选中,并赢得了50, 000美元的现金以及在科克郡一个实验室工作的能力,过去六个月来一直在该实验室工作。 该计划包括指导产品推销,Helixworks将在今年的South by Southwest音乐节上使用该产品,它将参加推销比赛。

Pinnamaneni说,虽然制造金色的DNA胶囊最终可能会是一个有利可图的副业,但他的公司的未来在于它现在正在开发的紧凑型家用和办公室DNA打印机。 他希望使DNA的存储变得容易且负担得起,任何人都可以使用。

Pinnamaneni解释说:“我们发现您需要像打印机中的墨盒那样工作的东西。” “您只有四种颜色,这四种颜色可以组合成任何可能的颜色,对吗?这就是您的墨水打印机的工作方式。我们发现我们的系统中需要类似的东西。我们设计了32种试剂盒,可以结合形成任何可能的DNA序列。”

Pinnamaneni说,虽然其他实验室每次需要合成DNA时每次都要花费约30, 000美元,但这项操作需要数周才能完成,Pinnamaneni说他的发明可以大大降低成本和时间。 Helixworks正在与制造自动实验室设备的公司Opentrons合作来创建打印机。 这就是SXSW的目标。

皮纳曼尼尼说:“我们将在博览会地板上展示的是DNA在眼前书写。”

该公司将不会接受任何订单。 那很好,因为那个浪漫的生物技术专家仍在等待他的周年纪念礼物。

需要一些额外的存储空间吗? 尝试dna