蛋白质结构与功能的预测方法总结和资料汇总

最新推荐文章于 2024-05-09 09:22:25 发布

AquilaEAG

最新推荐文章于 2024-05-09 09:22:25 发布

阅读量3w

点赞数 15

分类专栏：蛋白质结构预测

本文链接：https://blog.csdn.net/weixin_43202635/article/details/82903711

版权

蛋白质结构与功能的预测方法总结和资料汇总

“折叠（fold）”的概念
“折叠（fold）”是近年来蛋白质研究中应用较广的一个概念，它是介与二级和三级结构之间的蛋白质结构层次，它描述的是二级结构元素的混合组合方式。

蛋白质结构预测流程

一. 二级结构的预测方法介绍

Chou-Fasman算法

属于单序列预测方法，它是使用氨基酸物理化学数据中派生出来的规律来预测二级结构。

首先统计出20种氨基酸出现在α螺旋、β折叠和无规则卷曲中出现频率的大小，然后计算出每一种氨基酸在这几种构象中的构象参数Px。（构象参数值的大小反映了该种残基出现在某种构象中的倾向性的大小）
按照构象参数值的大小可以把氨基酸分为六个组：Ha（强螺旋形成者）、ha（螺旋形成者）、Ia（弱螺旋形成者）、ia（螺旋形成不敏感者）、ba（螺旋中断者）、Ba（强螺旋中断者）。
Chou和Fasman根据残基的倾向性因子提出二级结构预测的经验规则，要点是沿蛋白序列寻找二级结构的成核位点和终止位点。
这种方法可能能够正确反映蛋白质二级结构的形成过程，但预测成功率并不高，仅有50%左右

GOR算法

属于单序列预测方法，因其作者Garnier, Osguthorpe和 Robson而得名。
这种方法是以信息论为基础的，也属于统计学方法的一种，GOR方法不仅考虑被预测位置本身氨基酸残基种类对该位置构象的影响，也考虑到相邻残基种类对该位置构象的影响。
这样使预测的成功率提高到 65% 左右。GOR方法的优点是物理意义清楚明确，数学表达严格，而且很容易写出相应的计算机程序，但缺点是表达式复杂。