“折叠(fold)”的概念
“折叠(fold)”是近年来蛋白质研究中应用较广的一个概念,它是介与二级和三级结构之间的蛋白质结构层次,它描述的是二级结构元素的混合组合方式。
一. 二级结构的预测方法介绍
Chou-Fasman算法
属于单序列预测方法,它是使用氨基酸物理化学数据中派生出来的规律来预测二级结构。
首先统计出20种氨基酸出现在α螺旋、β折叠和无规则卷曲中出现频率的大小,然后计算出每一种氨基酸在这几种构象中的构象参数Px。(构象参数值的大小反映了该种残基出现在某种构象中的倾向性的大小)
按照构象参数值的大小可以把氨基酸分为六个组:Ha(强螺旋形成者)、ha(螺旋形成者)、Ia(弱螺旋形成者)、ia(螺旋形成不敏感者)、ba(螺旋中断者)、Ba(强螺旋中断者)。
Chou和Fasman根据残基的倾向性因子提出二级结构预测的经验规则,要点是沿蛋白序列寻找二级结构的成核位点和终止位点。
这种方法可能能够正确反映蛋白质二级结构的形成过程,但预测成功率并不高,仅有50%左右
GOR算法
属于单序列预测方法,因其作者Garnier, Osguthorpe和 Robson而得名。
这种方法是以信息论为基础的,也属于统计学方法的一种,GOR方法不仅考虑被预测位置本身氨基酸残基种类对该位置构象的影响,也考虑到相邻残基种类对该位置构象的影响。
这样使预测的成功率提高到 65% 左右。GOR方法的优点是物理意义清楚明确,数学表达严格,而且很容易写出相应的计算机程序,但缺点是表达式复杂。
多序列列线预测
对序列进行多序列比对,并利用多序列比对的信息进行结构的预测。调查者可找到和未知序列相似的序列家族,然后假设序列家族中的同源区有同样的二级结构,预测不是基于一个序列而是一组序列中的所有序列的一致序列。
基于神经网络的序列预测
利用神经网络的方法进行序列的预测,BP 网络即反馈式神经网络算法是目前二级结构预测应用最广的神经网络算法。
它通常是由三层相同的神经元构成的层状网络,使用反馈式学习规则,底层为输入层,中间为隐含层,顶层是输出层,信号在相邻各层间逐层传递,不相邻的各层间无联系,