人工智能工具预测未知蛋白质的功能
一种新的人工智能(AI)工具可以对未知蛋白质的功能进行逻辑推论,有望帮助科学家解开细胞的内部运作机制。
该工具由 KAUST 生物信息学研究员 Maxat Kulmanov 及其同事开发,其性能优于预测蛋白质功能的现有分析方法,甚至能够分析现有数据集中没有明确匹配的蛋白质[1]。
该模型被称为 DeepGO-SE,利用了类似于 Chat-GPT 等生成式人工智能工具所使用的大型语言模型。然后,它根据蛋白质工作方式的一般生物学原理,采用逻辑蕴涵得出关于分子功能的有意义的结论。
它本质上使计算机能够通过构建世界部分的模型(在本例中为蛋白质功能)来逻辑地处理结果,并根据常识和推理这些世界模型中应该发生的情况来推断最合理的场景。
“这种方法有很多应用,”监督这项研究的 KAUST 生物本体研究小组负责人 Robert Hoehndorf 说,“特别是当需要对神经网络或其他机器学习模型生成的数据和假设进行推理时, “他补充道。
Kulmanov 和 Hoehndorf 与 KAUST 的 Stefan Arold 以及瑞士生物信息学研究所的研究人员合作,评估该模型破译在体内作用未知的蛋白质功能的能力。
该工具成功地使用了有关人们知之甚少的蛋白质的氨基酸序列及其与其他蛋白质的已知相互作用的数据,并精确预测了其分子功能。该模型非常准确,以至于 DeepGO-SE 在一项国际函数预测工具竞赛中,在 1600 多个算法中排名前 20。
阿卜杜勒国王科技大学团队目前正在使用该工具来研究在沙特阿拉伯沙漠极端环境中茁壮成长的植物中发现的神秘蛋白质的功能。他们希望这些发现有助于识别生物技术应用的新型蛋白质,并希望其他研究人员采用该工具。
正如 Kulmanov 解释的那样:“DeepGO-SE 分析未表征蛋白质的能力可以促进药物发现、代谢途径分析、疾病关联、蛋白质工程、筛选感兴趣的特定蛋白质等任务。”
版权声明:本文由用户上传,如有侵权请联系删除!