蛋白质--由氨基酸组成的大分子,是组织、肌肉、头发、酶、抗体和生物体其他重要部分的基本组成部分--以DNA编码。 正是这些基因定义限制了它们的三维结构,这又决定了它们的能力。例如,抗体蛋白的形状像“Y”,使它们能够锁定病毒和细菌,并且胶原蛋白的形状像绳索,其在软骨,骨骼,皮肤和韧带之间传递张力。
蛋白质折叠是什么?蛋白质的基本单位为氨基酸,而蛋白质的一级结构指的就是其氨基酸序列,蛋白质会由所含氨基酸残基的亲水性、疏水性、带正电、带负电等特性通过残基间的相互作用而折叠成一立体的三级结构。虽然蛋白质可在短时间中从一级结构折叠至立体结构,研究者却无法在短时间中从氨基酸序列计算出蛋白质结构,甚至无法得到准确的三维结构。
事实上,科学家们估计,由于氨基酸之间相互作用的数量无法计算,要想确定一种典型蛋白质的正确结构,需要花费138亿年以上的时间才能弄清其所有可能的结构。
幸运的是,这是一份适合人工智能(AI)的工作。谷歌的子公司DeepMind本周宣布了AlphaFold,这是一种人工智能系统,能够比以前最先进的解决方案更精确地预测蛋白质结构。DeepMind的研究人员在一篇博客文章中写道,这是两年工作的成果,是基于多年的基因组学研究。
“在过去的五十年中,科学家们已经能够使用冷冻电子显微镜,核磁共振或X射线晶体学等实验技术来确定实验室中蛋白质的形状,但每种方法都依赖于大量的试验和错误,可能需要数年时间,每个结构需要花费数万美元,”该团队写道, “幸运的是,由于基因测序成本的迅速降低,基因组学领域的数据非常丰富。 因此,在过去几年中,依赖于基因组数据的预测问题的深度学习方法变得越来越流行。”
DeepMind团队专注于从零开始建模目标形状的问题,并使用两种方法构建完整蛋白质结构的预测。具体来说,他们的人工智能系统的深层神经网络——模仿人脑神经元行为的数学功能层——能够估算氨基酸对之间的距离,以及连接这些氨基酸的化学键之间的角度。
AlphaFold中的一个神经网络通过将蛋白质结构片段与新的蛋白质片段重复放置来预测蛋白质中氨基酸残基对之间的距离分布。生成模型创建新的碎片,用于不断提高精度。
AlphaFold在性能方面轻松击败了其他解决方案。在坎昆举行蛋白质折叠结构预测CASP大赛中,它击败了98名参赛者,成功预测了43种蛋白质中的25种的结构。(排名第二的系统只能预测三种蛋白质结构。)更令人印象深刻的是,它成功地在几个小时内预测出了它的第一个蛋白质结构——比以前的系统快了几个数量级。2016年谷歌围棋人工智能AlphaGo战胜世界围棋大师韩国棋手李世石。
DeepMind团队指出,提高科学界对蛋白质折叠的理解,可能有助于更有效地诊断和治疗帕金森病和阿尔茨海默病等疾病,因为这些疾病被认为是由错误折叠的蛋白质引起的。此外,它还有助于蛋白质的设计,例如,它可以帮助分泌蛋白质的细菌,使废水可生物降解,还可以帮助管理塑料和石油等污染物的酶。
研究人员写道:“看到这些蛋白质折叠方面取得进展的早期迹象,证明人工智能对科学发现的效用,这令人兴奋。尽管在我们能够在治疗疾病、管理环境等方面产生可量化的影响之前还有很多工作要做,但我们知道潜力是巨大的。我们拥有一支专注于研究机器学习如何推动科学世界的团队,我们期待看到我们的技术能够在许多方面发挥作用。”
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734