同源模建大致流程
1. 同源蛋白的搜索
2.序列比对
3.构建蛋白保守区
4.构建蛋白可变区
5.补全氨基酸残基
6.蛋白结构的评价
3-5.构建蛋白质保守区、构建蛋白可变区、补全氨基酸残基
1.基础概念
蛋白质结构保守区(SCRs):在生物进化或蛋白家族中具有不变或相同的结构域,具备重要功能不能改变。
同一家族中一个蛋白为另一个蛋白分配原子坐标的基础,这部分称为结构保守区。
蛋白结构Loop区:蛋白质肽链中除去螺旋和β折叠的第三种二级结构,通常具有较大的柔性。
氨基酸侧链:与主链连接着的一些氨基酸,有较大柔性。
2.建模方法
- 刚体装配法:利用SCRs序列相似度最高片段。
- 加权平均法:利用同源结构族的平均结构。
- 基于知识的蛋白质的建模方法:1.空间限制满足法(satisfaction of spatial restrains)以各种途径衍生出限制条件,包括同源蛋白,分子力学场,实验数据等。2.基于片段装配法(fragment-based assembly)主要应用于loop及氨基酸侧链的建模,搜寻已知结构蛋白中与目标蛋白相似的那部分。
6.蛋白质结构评价
立体化学、RMSD、PROSA程序评价、Verify3D、碳骨架二面角
- 立体化学:
Procheck:对于模型中残基与残基之间的立体化学性质做出评价常以Ramachandran图(拉式图)表示;
Erract:评价原子间非键相互作用的整体性质。
- RMSD:均方根误差是一种常用的测量数值之间差异的量度,其数值常为模型预测的量或是被观察到的估计量。(不同模型之间的特定的数值)
- PEOSA:模型能量方面的评价,用于评价每个残基之间的相互作用是否在一个合理范围内。
-
Verify3D:通过3D轮廓测量,建立原子蛋白质模型与其自身氨基酸序列的相容性。Verify3D过程通过根据每个残基位置的位置和环境分配结构类,并将结果与良好结构进行比较。残基的环境对应于三个参数,局部二级结构、掩埋的残基面积、极性原子覆盖的侧链区域的分数。
-
碳骨架二面角——α-碳原子的二面角。