您的位置:首页>AI>

人工智能在解决蛋白质结构方面取得了胜利

人工智能(AI)解决了生物学的一项重大挑战:预测蛋白质如何从氨基酸的线性链卷曲成3D形状,从而使它们能够执行生活任务。今天,两年一次的蛋白质折叠竞赛的主要结构生物学家和组织者宣布了英国AI公司DeepMind的研究人员所取得的成就。他们说,DeepMind方法将产生深远的影响,其中包括极大地加快新药的开发速度。

欧洲生物信息学研究所名誉主任珍妮特·桑顿说:“ DeepMind团队所取得的成就非常了不起,它将改变结构生物学和蛋白质研究的未来。” “这是一个已有50年历史的问题,”马里兰大学Shady Grove的结构生物学家,该竞赛的共同创始人,蛋白质结构预测的关键评估(CASP)的约翰·莫尔特(John Moult)补充道。“我从没想过我会一辈子看到这个。”

人体使用成千上万种不同的蛋白质,每种蛋白质包含数十至数百个氨基酸。这些氨基酸的顺序决定了它们之间无数的推拉作用如何产生蛋白质的复杂3D形状,进而决定了它们的功能。了解这些形状有助于研究人员设计出可以滞留在蛋白质口袋和缝隙中的药物。能够合成具有所需结构的蛋白质可以加快酶的发展,这些酶可以制造生物燃料并降解废塑料。

数十年来,研究人员使用诸如X射线晶体学或低温电子显微镜(cryo-EMscopy,cryo-EMscopy)等实验技术来解密蛋白质的3D结构。但是,这种方法可能要花费数月或数年,并且并不总是有效。在生命形式中发现的超过2亿种蛋白质中,只有约170,000种的结构已被解析。

在1960年代,研究人员意识到,如果他们能够计算出蛋白质序列内的所有个体相互作用,就可以预测其3D形状。每个蛋白质具有数百个氨基酸,并且每对氨基酸可以通过多种方式相互作用,但是,每个序列可能的结构数目是天文数字。计算科学家跳上了这个问题,但进展缓慢。

1994年,Moult及其同事发起了CASP,每两年召开一次。进入者获得约100种蛋白质的氨基酸序列,其结构未知。一些小组计算每个序列的结构,而另一些小组则通过实验确定它。然后,组织者将计算预测结果与实验室结果进行比较,并为预测结果提供全球距离测试(GDT)分数。穆尔特说,零分到100分的90分以上得分与实验方法相当。

即使在1994年,小而简单的蛋白质的预测结构也可以与实验结果相匹配。但是对于较大的,具有挑战性的蛋白质,计算的GDT得分约为20,“完全是一场灾难”,马克斯·普朗克发育生物学研究所的CASP法官和进化生物学家安德烈·卢帕斯说。到2016年,竞争小组的最坚硬蛋白质得分已达到约40,主要是通过从与CASP目标密切相关的已知蛋白质结构中得出的见解。

免责声明:本文由用户上传,如有侵权请联系删除!