文章目录
相关链接
http://3g.dxy.cn/bbs/topic/31372707?sf=2&dn=4 (modeller详细中文使用教程)
https://salilab.org/modeller/tutorial/ (modeller官方tutorial)
1 蛋白质模建的几种方法
1.1 同源模建
- Modeller URL:https://salilab.org/modeller/
- Swiss-Model URL:https://swissmodel.expasy.org/interactive
其中的Modeller是基于Python语言构建的。相对来说,Modeller比其他的预测方法更快,但是准确度依旧有欠缺。这也是所有的同源比对方法的共同缺陷。Modeller需要本地构建确定的模板,之后进行本地计算,并不提供相关的在线服务(Swiss提供)。
所以我们选择了Swiss-Model进行在线识别。
1.2 折叠识别
- pGenThreader URL:http://bioinf.cs.ucl.ac.uk/psipred/
- FFAS03 URL:http://ffas.burnham.org
原理:
折叠识别是通过在蛋白质结构数据库中识别与待测序列具有相似折叠类型,进而实现对待测序列的空间结构预测。自然界中蛋白质折叠类型的数目是有限的,许多蛋白质虽然享有很低的序列相似性,但它们仍可能具有相同的折叠类型,这就是折叠识别的理论依据。现在普遍认为,折叠类型的总体数目会在几千以内,近年来,虽然许多新蛋白质的结构不断被解析,但折叠类型数目的增长趋于平缓。例如,CATH数据库(截至2014年7月18日统计数字)把PDB数据库中所有蛋白质结构归入1313个不同的拓扑类型( topology),且自2010年以来再没有新类型出现。对于一个待测序列,如果它所对应的折叠类型已被实验测定,如何通过合适的计算方法找出它所对应的折叠类型,就是折叠识别要解决的核心问题。
1.3 从头预测
- QUARK URL:http://zhanglab.ccmb.med.umich,edu/QUARK/
- Rosetta URL:https://www.rosettacommons.org/software
原理:
从头计算法的原理是蛋白质的天然构象对应其能量最低的构象,因此通过构造合适的能量函数及优化方法,可以实现从蛋白质序列直接预测其三维结构的目的。由于很难找到精准的能量函数,以及多能量优化过程中存在大量的局部最小值,目前从头计算法还远未像前两种方法那样成熟实用,它一直是蛋白质结构预测中最具挑战性的课题。从头计算法的物理化学意义明晰,不依赖于模板,有可能预测到全新的蛋白质结构,所以一直受到许多研究人员的青睐。最近,从头计算法已取得很大的突破,对一些含氨基酸数量为100~200的较小的蛋白质,有可能预测得到高精度的三维结构。所以,当采用同源模建和折叠识别无法实现对待测蛋白的空间结构预测时,可以考虑采用从头计算法来获得结构模型。虽然单纯运用从头计算方法得到的模型还不能可靠地用于分子对接和药物分子设计,但预测得到的一些低分辨率的结构模型结果可用来作蛋白质功能注释,新的算法也增强了我们对蛋白质折叠机制的认识。鉴于从头计算法涉及较多的物理化学原理和数学方法,为便于理解,不对具体的能量函数及能量优化方法展开论述,只是通过介绍一个较为流行的软件来加深读者对从头计算法的理解。
1.4综合方法
- I-TASSER URL:http://zhanglab.ccmb.medumich.edu/i-tasser/