在blast中E值(E value)是什么?

一般的,当我们使用BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序)时,我们会注意到这里有一个E值。那么这个E value是什么呢?怎么来理解这个值呢?

下面是一个平常的blast结果,

Sequences producing significant alignments:Score (S)E
gi|83574104|Moth_2374|sporulation – prote…2022e-53
gi|83573446|Moth_1696|Sporulation – prote…1121e-26
gi|83571874|Moth_0087|sporulation – prote…953e-21
gi|83573435|Moth_1685|Substrate-binding -…271.0

后面有两个值,一个是S值,一个E值。可以发现,结果是依据S值的高低来显示的。

S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。
E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
E值的计算:
E=Kmn(e-lambda*S)
其中,K和lambda与数据库和算法有关,是个常量;m代表目标序列的长度,n代表数据库的大小,S就是前面提到的S值。
通常来讲,我们认为E值小于10-5就是比较可性的S值结果。我们可以想象,相同的数据库,E=0.001时如果有1000条都有机会S值比现在这个要高的话,那么不E设置为10-6时可能就会只得到一条结果,就是S值最可靠的那个。

但是E值也不是万能的。它在以下几个情况下有局限性:

1. 当目标序列过小时,E值会偏大,因为无法得到较高的S值。
2. 当两序列同源性虽然高,但有较大的gap(空隙)时,S值会下降。这个时候gap scores就非常有用。
3. 有些序列的非功能区有较低的随机性时,可能会造成两序列较高的同源性。

BLAST试图去避免这些问题,但是还是应该自己有个清晰的概念。

E值总结:

E值适合于有一定长度,而且复杂度不能太低的序列。
当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。
当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。

  • 7
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: BLAST是一种用于比对序列相似性的计算生物学工具。它可以将一个查询序列与一个或多个数据库序列进行比对,并输出相似度最高的比对结果。常用的 BLAST 程序有 BLASTn、BLASTp、BLASTx 和 TBLASTn。 ### 回答2: 基因组学blast(即基本局部序列比对搜索工具)是一种常用的基因序列比对算法。它可以比较两个或多个DNA、RNA或蛋白质序列之间的相似性。 blast广泛应用于基因组学研究的多个方面。首先,它可以用于确定一个未知序列的功能和归属。通过与已知基因库的序列比对,blast可以快速找到候选序列的最佳匹配。这有助于揭示未知序列可能的功能和结构。 其次,blast可以用于寻找已知基因在不同物种的同源基因。通过比对不同生物之间的DNA或蛋白质序列,blast可以快速确定两个物种之间基因的演化关系和共同祖先。 此外,blast可以用于发现并研究基因家族。基因家族是指一组具有共同起源但功能略有差异的基因序列。借助blast,研究人员可以将一个已知基因序列与数据库的其他相关序列比对,从而找到具有相似序列的基因,并进一步研究这些基因在不同物种的功能和进化。 总之,blast在基因组学起着非常重要的作用。它帮助研究人员寻找和确定未知序列的功能和归属,揭示基因间的演化关系,以及研究基因家族的起源和功能差异。 ### 回答3: 在基因组学BLAST(基本局部对齐搜索工具)是一种广泛应用的算法和程序,用于序列比对和序列相似性搜索。BLAST能够快速在数据库搜索相似的序列,从而帮助研究人员了解待研究序列的功能和结构。 BLAST的工作原理是通过比较一个给定的查询序列与已知的数据库的序列,寻找相似性,即寻找序列间的正常局部对齐。BLAST可以用于比对DNA序列、蛋白质序列和其他生物大分子序列。它通过寻找长的完全匹配序列、部分匹配的短片段或者指定的子串来找到相似性。 BLAST搜索在基因组学有很多应用。首先,BLAST可以用于标定未知序列的功能。例如,在基因组测序,当获得一段DNA序列时,BLAST可以在数据库搜索相似的已知序列,从而帮助鉴定该DNA的功能。此外,BLAST还可以用于寻找已知基因组的变异位置,帮助解释遗传疾病的发生机制,以及研究物种间的进化关系。 总之,BLAST在基因组学扮演了重要的角色,它利用快速的序列对比技术,帮助研究人员确定序列的相似性和功能,促进了基因组学的研究和进展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值