神经网络帮助设计全新蛋白质
蛋白质凭借其复杂的排列和动态功能,通过采用简单构建块的独特排列(其中几何形状是关键)来执行大量的生物任务。将这个几乎无限的排列库转化为各自的功能可以让研究人员设计用于特定用途的定制蛋白质。
在AIP 出版社的《应用物理学杂志》中,麻省理工学院的 Markus Buehler 将注意力神经网络(通常称为 Tranormer)与图神经网络结合起来,以更好地理解和设计蛋白质。该方法将几何深度学习的优势与语言模型的优势结合起来,不仅可以预测现有的蛋白质特性,还可以设想自然界尚未设计出的新蛋白质。
“通过这种新方法,我们可以通过对基本原理进行建模,将大自然发明的一切作为知识基础,”布勒说。“该模型重新组合了这些自然构建块,以实现新功能并解决这些类型的任务。”
由于其复杂的结构、多任务能力以及溶解时形状变化的倾向,蛋白质一直难以建模。机器学习已经证明能够将控制蛋白质行为的纳米级力量转化为描述其功能的工作框架。然而,反其道而行之——将所需的功能转化为蛋白质结构——仍然是一个挑战。
为了克服这一挑战,布勒的模型将数字、描述、任务和其他元素转化为符号供他的神经网络使用。
他首先训练他的模型,根据不同蛋白质的功能来预测它们的测序、溶解度和氨基酸组成部分。然后,他在收到新蛋白质功能的初始参数后教它发挥创造力并生成全新的结构。
这种方法使他能够创造出以前必须溶解在水中的固体抗菌蛋白。在另一个例子中,他的团队采用了一种天然存在的丝蛋白,并将其进化成各种新形式,包括赋予其螺旋形状以增加弹性或褶皱结构以增加韧性。
该模型执行了设计新蛋白质的许多核心任务,但 Buehler 表示,该方法可以为更多任务纳入更多输入,从而有可能使其变得更加强大。
“一个很大的惊喜是,尽管该模型是为了能够解决多项任务而开发的,但它的表现却异常出色。这可能是因为该模型通过考虑不同的任务学到了更多东西,”他说。“这一变化意味着研究人员现在可以广泛地思考多任务和多模式模型,而不是为特定任务创建专门的模型。”
这种方法的广泛性意味着该模型可以应用于蛋白质设计之外的许多领域。
“虽然我们目前的重点是蛋白质,但这种方法在材料科学中具有巨大的潜力,”布勒说。“我们特别热衷于探索材料失效行为,旨在设计具有特定失效模式的材料。”
版权声明:本文由用户上传,如有侵权请联系删除!