由于流感和艾滋病毒变异非常快,这使得它们能够通过一种被称为“病毒逃逸”的过程来逃避特定疫苗产生的抗体,因此生产相应的有效疫苗就十分困难。
现在,麻省理工学院的研究人员设计了一种新的方法,根据最初开发的分析语言的模型,对病毒逃逸进行计算建模。
该模型可以预测病毒表面蛋白质的哪些部分更容易变异,从而使病毒能够逃脱。该方法还可以识别不太可能变异的部分,使它们成为新疫苗的目标之一。
上面提到的模型一开始用于分析语言模式,具体来说,就是某些单词一起出现的频率。
研究人员认为,这种模型也可以应用于生物信息,如遗传序列。在这种情况下,语法类似于确定特定序列编码的蛋白质是否有功能的规则,语义类似于蛋白质是否可以呈现新的形状来帮助它逃避抗体。
为了模拟这一过程,研究人员训练了一个NLP模型来分析基因序列中发现的模式,这使得它可以预测具有新功能但仍然遵循蛋白质结构生物学规则的新序列。这种建模的一个显著优点是,它只需要序列信息,这比蛋白质结构更容易获得。
该模型可以在相对少量的信息上进行训练——在这项研究中,研究人员使用了60000个艾滋病毒序列、45000个流感序列和4000个冠状病毒序列。
研究人员称“语言模型非常强大,因为它们可以学习这种复杂的分布结构,并从序列变异中获得对功能的一些了解。”
一旦模型得到训练,研究人员就用它来预测冠状病毒尖峰蛋白、艾滋病毒包膜蛋白和流感血凝素(HA)蛋白的序列,这些序列或多或少地可能产生逃逸突变。
对于流感,该模型揭示了最不可能变异和产生病毒逃逸的序列在透明质酸蛋白的茎中。这与最近的研究一致,研究表明针对透明质酸茎的抗体(大多数感染流感或接种流感疫苗的人都不会产生这种抗体)可以提供针对任何流感病毒株的保护。
该模型对冠状病毒的分析表明,被称为S2亚单位的尖峰蛋白的一部分最不可能产生突变。
关于新冠病毒变异速度的问题仍然存在,因此目前用于抗击新冠肺炎大流行的疫苗还能有效多久还不得而知。
初步证据表明,这种病毒不会像流感或艾滋病毒那样迅速变异。然而,研究人员最近发现了在新加坡、南非和马来西亚出现的新突变,他们认为应该对潜在的病毒突变进行调查(这些新数据尚未经过同行审查)。
在他们对艾滋病毒的研究中,研究人员发现该蛋白质的V1-V2高变区有许多可能的突变,这与以前的发现一致,他们还发现了逃逸概率较低的序列。
研究人员现在正与其他团队合作,使用他们的模型来确定癌症疫苗的可能目标,这些疫苗通过刺激人体自身的免疫系统来消灭癌症。
编译/前瞻经济学人APP资讯组
论文链接:
https://science.sciencemag.org/content/371/6526/284
https://science.sciencemag.org/content/371/6526/233
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734