当前位置: 首页 - 智能仪表资讯 - 深度学习平台DeepMind将其突破性的AlphaFold蛋白质结构预测模型开源登上自然杂志引起社会

深度学习平台DeepMind将其突破性的AlphaFold蛋白质结构预测模型开源登上自然杂志引起社会

2025-01-08 智能仪表资讯 0

深度学习平台DeepMind开源其突破性AlphaFold蛋白质结构预测模型,登上《Nature》杂志,引发社会广泛关注,同时也为考研学子提供了最新的科学研究资讯。根据雷锋网报道,AlphaFold在2018年11月2日获得了第13届全球蛋白质结构预测竞赛(CASP)上的冠军,其预测方法被认为是计算能力突出所致。

1月15日,DeepMind关于AlphaFold模型与代码通过同行评审发布在《Nature》上,并且模型和代码已开源。用户可以访问GitHub查看具体的代码和实现方式。

据介绍,在预测蛋白质结构的物理性质方面,AlphaFold使用两种不同的方法构建预测模型,这两种方法都是基于深度神经网络设计。其中一种方法利用神经网络预测每一对氨基酸之间的概率分布,然后将这些概率合并为一个分数,以估计预测蛋白质结构的准确性。此外,还训练了一个单独的神经网络来评估预测与实际结构之间的接近程度。

另一种方法采用梯度下降优化分数,以达到更高精度。在整个蛋白质结构链的预测过程中,将梯度下降应用于整个链,而不仅仅是“碎片”。该模型结合了深度学习和传统算法,如CNN+Rosetta,其中神经网络首先预测残基间方向和距离,然后用Rosetta进行同源建模、结构修复。

尽管训练数据集全部为天然蛋白质,但该模型能够找到决定残基关键折叠和建立“理想”蛋白质结构标准。此外,该模型还包括两个关键部分:第一部分是一个深度残差卷积神经网络,将多序列比对作为输入;输出信息为氨基酸中的相对距离和方向。第二部分是在网络输出基础上针对距离和方向最小化约束建立快速Rosetta模型。

对于测试集,上述两个独立测试集分别来自CASP13和CAMEO实验。在CASP13数据集中,DeepMind使用完整蛋白质序列而不是只包含特定区域序列来模拟。这项工作由DeepMind公开论文《Improved protein structure prediction using predicted inter-residue orientations》详细介绍,其中展示了如何结合CNN+Rosetta来提高蛋白質結構預測精確性。

最后,对于感兴趣读者,可以通过以下链接获取更多信息以及试验代码:

GitHub地址:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13

模型详情:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf

标签: 智能仪表资讯