如何看懂NCBI BLAST输出结果
2010-11-13 10:38:11| 分类:生物信息分析| 标签:blast |字号大中小订阅
本文转自:http://www.doczj.com/doc/72610480ec3a87c24028c477.html/bio/?p=1632
写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast 是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。
最新的BLAST结果报告解读,本文以BLASTP为例子,说明如何来解读BLAST 结果。
示例
BLAST地址:
http://www.doczj.com/doc/72610480ec3a87c24028c477.html/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=b lastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthom e
比对用的例子:
>gi|16758036|ref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus] MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKG MPHKCYHGKTGRVYNVTQH AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKG TWVQLNGQPAPPREAHF
VRTNGKEPELLEPIPYEFMA
数据选择:nr
比对时间:2009年9月9日12:46:23
解读报告前需要掌握的概念:
alignments 代表比对上的两个序列
hits 表示两个序列比对上的片段
Score 比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高
E Value 值越小,越可信,相对的一个统计值。
Length 输入序列的长度
Identities 一致性,就是两个序列有多少是一样的
Query 代表输入序列
Sbjct 代表数据库中的序列
结果详细说明
菜单与基本信息