原理
根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列肽链空间结构和生物功能;也可以通过分子动力学、分子热力学等,根据能量最低、同一位置不能同时存在两个原子等基本原则分析计算蛋白质分子的立体结构和生物功能。
步骤
蛋白质结构的理论预测方法都是建立在氨基酸的一级结构决定高级结构的理论基础上,大致分为以下三类。
( 1 )比较建模法( comparative modeling method )
比较建模法是基于知识的蛋白质结构预测方法,又称为同源结构预测,是根据大量已知的蛋白质三维结构来预测序列已知而结构未知的蛋白质结构。
按照目前的定义,若待模型构建蛋白质的序列与模板序列经比对( alignment )后的序列同源性( sequence identity )在 40% (也有人认为在 35% )以上,则它们的结构可能属于同一家族,它们是同源蛋白( homology ),可以用同源蛋白模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,它们具有相似的空间结构,相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其它一些序列已知而结构未知的同源蛋白的结构,可以用同源模型构建的方法预测未知蛋白质的三维结构。 常用的数据库是swiss-model和interproscan。
同源蛋白模型构建(模建)的步骤:
① 目标蛋白序列与目标序列的匹配:应用 FASTA 或 BLAST 搜索软件,在 PIR 、 SWISSPROT 或 GENEBANK 等序列库中按序列同源性挑选出一些同源性比较高的序列,然后把挑选出的序列与目标序列基序