得分矩阵PAM与BLOSUM的比较与区别

本文介绍了蛋白质序列比对中常用的两种得分矩阵——PAM和BLOSUM。PAM矩阵基于进化点突变模型,适合相似度较高的序列比对,而BLOSUM矩阵则使用更多蛋白质家族数据,适用于不同保守性水平的序列比较。PAM矩阵随着n值增大,对应序列差异增加;而BLOSUM矩阵中,n值增大则意味着氨基酸相似度降低。
摘要由CSDN通过智能技术生成

 对于蛋白质序列,计分矩阵主要用于记录在做序列比对时两个相对应的残基的相似度,一旦这个矩阵定义好了以后,比对程式就可以利用这个矩阵,尽量将相似的残基排在一起,以达到最好的比对。
  得分矩阵主要有两种,第一种就是PAM(Point Accepted Multation),另一种就是BLOSUM。
1、PAM矩阵(Point Accepted Mutation)
   基于进化的点突变模型,如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变,但这并不意味100次PAM后,每个氨基酸都发生变化,因为其中一些位置可能会经过多次突变,甚至可能会变回到原来的氨基酸。
PAM矩阵的制作步骤:
    构建序列相似(大于85%)的比对
    计算氨基酸 j 的相对突变率mj(j被其它氨基酸替换的次数)
    针对每个氨基酸对 i 和 j , 计算 j 被 i 替换次数
    替换次数除以相对突变率(mj)
    利用每个氨基酸出现的频度对j 进行标准化
    取常用对数,得到PAM-1(i, j)
    将PAM-1自乘N次,可以得到PAM-N。

  这种矩阵的缺点是一旦PAM1的矩阵有效地误 差,那么自乘250后得到的PAM250矩阵的误差就会变得很大。

如,PAM120矩阵用于比较相距120个PAM单位的序列。
     一个PAM-N矩阵元素(i,j࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值