Rosetta基础3: Rosetta能量函数简介

最新推荐文章于 2024-10-08 17:39:57 发布

今天也在认真分享

最新推荐文章于 2024-10-08 17:39:57 发布

阅读量522

点赞数 1

文章标签：数据库人工智能深度学习机器学习

本文链接：https://blog.csdn.net/2302_76987110/article/details/130261086

版权

Rosetta能量函数是评估蛋白质结构模型的重要工具，它通过一系列能量项如LJ势、静电势、氢键相互作用等，结合物理和统计方法，对模型进行打分。该函数有助于判断模型的稳定性和可靠性，与直观判断相吻合。本文深入探讨了Rosetta能量函数的类型、分类和具体解释，涉及One Body、Two Body和Whole Body能量项，以及统计和物理势能项。通过对不同氨基酸构象和相互作用的计算，Rosetta能够准确评估模型的好坏。

摘要由CSDN通过智能技术生成

一、导读

在Rosetta中评估一个模型的好坏，最直观的方法就是使用Rosetta的打分系统进行评估，也就是常说的能量函数。顾明思议，我们通过一些与能量直接相关的打分项对蛋白质的结构坐标进行打分的过程。

读者可自行凭借直觉评估，上图中绿色和粉红色的两个蛋白质预测的结构哪个更接近于真实的情况？哪个模型更加地可靠呢？

如果是比较有经验的人士，会认为绿色的模型更接近于真实的蛋白结构，原因是蛋白质往往依靠疏水相互作用驱使折叠成能量最低的状态，而粉红色的右下角处的α螺旋与周围的结合紧密程度较差，蛋白质存在空腔。如果我们使用Rosetta能量函数去打分，那么绿色模型的能量也显著低于粉红色的模型。也就是说Rosetta的能量函数与我们直觉的判断结果一致。那么有趣的问题来了，Rosetta能量函数为何可以较为准确地评估模型的好坏？

二、Rosetta能量项类型与分类

Rosetta能量函数由一系列可衡量的几何统计或经典物理相互作用能量经过加权后得到的函数形式。在给定原子坐标的条件下，评估原子之间的相互作用能量的大小。在之前版本的Rosetta中，能量的单位是REU(Rosetta Energy Unit)，而最新版本的full-atom打分函数(ref2015))经过矫正，目前单位为kcals/mol。

从相互作用类型来分，Rosetta的打分项通常分为3类:

One Body：通常这类打分项只和单个氨基酸构象有关，比如骨架的二面角，侧链的rotamer构象等

Two Body：这类打分项与两个氨基酸有关，比如范德华力相互作用，静电相互作用

Whole Body：从整体几何性质或其他的指标考虑蛋白质的能量，如蛋白质的回旋半径，二级结构组成等可统计的量

从打分项的拟合方法上来区分，可分为物理势能项和统计势能项：

物理势能项通常是从物理上定义的分子相互作用经典公式去计算得到的值，比如范德华力的LJ势函数，库仑力的静电势函数。
统计势能项，一般是从蛋白质结构数据库中统计得到。这里有个比较重要的前提假设就是，在数据集中，出现概率越高的性质或则构象，其能量越低，出现罕见的则能量越高（玻尔兹曼分布），因此可以通过测定频率直接取对数近似能量的大小值。比如，我通过统计蛋白质主链上的phi, psi角的分布情况就可以统计得到Ramachandran图，其中点越富集说明这些主链构象的能量越低，在自然界中频繁被观测到。

简单来说在得到了多个打分项后，通常会在给定一些数据集条件下，通过拟合权重，就可以表现比较良好的打分函数，Rosetta能量函数拟合也是如此。举个例子，通过ab-inito的fragment组装得到了大量预测的蛋白质结构模型，通过尝试调整和组合每一项的打分权重，试图将与晶体最接近的那个模型能量拟合为最低的能量状态。