PSI-BLAST 介绍
- 基本定义:PSI-BLAST 全称为 Position-Specific Iterated BLAST(位点特异性迭代 BLAST)。它是一种对蛋白质序列进行相似性搜索的生物信息学工具,是 BLAST(Basic Local Alignment Search Tool)算法的改进版本。
- 工作原理:
- 初始搜索:首先进行一次标准的 BLASTP 搜索,从蛋白质数据库中找到与查询序列相似的序列,形成一个初始的比对结果。
- 构建位置特异性矩阵(PSSM):根据初始比对结果,PSI-BLAST 会构建一个位置特异性矩阵。这个矩阵记录了每个位置上不同氨基酸出现的频率和概率信息,反映了在已知相似序列的背景下,每个位置对不同氨基酸的偏好性。
- 迭代搜索:使用构建好的位置特异性矩阵,再次对蛋白质数据库进行搜索。这次搜索会更加关注与位置特异性矩阵相匹配的序列,从而能够发现一些在初始搜索中可能被忽略的、与查询序列较远的同源序列。经过多次迭代,不断更新位置特异性矩阵,提高搜索的灵敏度和准确性。
- 主要应用:
- 发现远缘同源蛋白:对于研究蛋白质的进化关系、功能预测等方面非常有帮助。例如,在研究一个新发现的蛋白质时,通过 PSI-BLAST 可以找到与其具有远缘同源关系的其他蛋白质,从而推测该蛋白质的功能和可能的生物学作用。
- 蛋白质家族分析&