深度学习对蛋白质结构建模的影响

最新推荐文章于 2024-06-26 23:51:07 发布

uiiooooo

最新推荐文章于 2024-06-26 23:51:07 发布

阅读量880

点赞数

分类专栏：蛋白质设计文章标签：深度学习人工智能大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yy19980310/article/details/123297187

版权

蛋白质设计专栏收录该内容

1 篇文章 1 订阅

订阅专栏

传统方法：

代表为Rosetta软件。

基于物理模型，使用力场和能量函数来描述生物分子中原子间的相互作用，表示为原子间的非共价范德华、静电、氢键等作用关系的和。

第一个问题在于，蛋白质的构象空间是十分庞大的。分子动力学方法只有不到一毫秒的模拟时间，因此除了很小的蛋白只能分析蛋白起始状态。基于蒙特卡洛法的Rosetta试图寻找蛋白链与较大蛋白纠缠时的最小能量状态，因此有更大的构象空间。

第二个问题在于力场的精确性。预测的精确性取决于对力场建模的精确性。

鉴于经过复杂的进化历程，实际氨基酸序列排列有限，将此作为约束可以大大提升此类方法的性能。

引入深度学习的方法：

代表为RoseTTAFold和AlphaFold。

与传统方法不同之处在于，利用深度学习搭建的模型可以拥有百万个参数，而传统方法只有数百个。另外深度学习模型对函数形式没有约束，其学习（定义）过程是由氨基酸序列直接到蛋白质三维结构的映射。

与传统方法相似之处在于，都是通过迭代过程逐步逼近正确结构（但深度学习迭代更新基于当前结构的表达，而非分子动力或蒙特卡洛轨迹，这种方式更有利于全局优化，因为传统方法不一定每一步朝着最优方向）。

在训练过程中，RoseTTAFold和AlphaFold由大量同源序列而不是单序列预测结构，但这些冗余的信息在预测过程中不是必须的，仅使用单序列有时也能起到很好的效果。在蛋白质设计领域，使用训练好的模型可以设计大量新结构，已经受到了X射线晶体学和NMR的检验；另外类比语言模型（给出前几个单词完成整个句子），可以从简单的位点的序列生成完成序列或结构。

未来的挑战：

深度学习模型的训练需要大量数据集，包括结构的原子坐标及相互作用关系，这些数据需要长时间的积累。在某些应用性比较好的领域如药物设计，这类数据是不公开的或体量非常少的。同样，在利用自然界不存在的氨基酸或非蛋白骨架设计时可用来训练的数据更加难以获取。在这种情况下，可以同时使用深度学习方法和基于物理的传统方法。

参考文献：
Baek M, Baker D. Deep learning and protein structure modeling[J]. Nature methods, 2022, 19(1): 13-14.

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
深度学习对蛋白质结构建模的影响

传统方法：代表为Rosetta软件。基于物理模型，使用力场和能量函数来描述生物分子中原子间的相互作用，表示为原子间的非共价范德华、静电、氢键等作用关系的和。第一个问题在于，蛋白质的构象空间是十分庞大的。分子动力学方法只有不到一毫秒的模拟时间，因此除了很小的蛋白只能分析蛋白起始状态。基于蒙特卡洛法的Rosetta试图寻找蛋白链与较大蛋白纠缠时的最小能量状态，因此有更大的构象空间。第二个问题在于力场的精确性。预测的精确性取决于对力场建模的精确性。鉴于经过复杂的进化历程，实际氨基酸序列排列有限
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。