比对软件-blastN结果详解

不锈铁

已于 2023-09-25 09:55:56 修改

阅读量1w

点赞数 4

分类专栏：数据分析生信 linux 文章标签： python

于 2022-07-24 17:04:33 首次发布

本文链接：https://blog.csdn.net/hac_kill_you/article/details/125961236

版权

生信同时被 3 个专栏收录

25 篇文章

订阅专栏

数据分析

14 篇文章

订阅专栏

linux

6 篇文章

订阅专栏

本文详细介绍了如何使用BLAST进行序列比对，包括构建索引和执行比对的命令，以及比对结果的解读。比对结果包含查询序列ID、参考序列ID、一致性百分比、比对区域长度等12项关键信息，用于评估序列间的相似性。同时，解释了E值和bitscore在评估比对质量中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. 比对命令

# 构建索引
makeblastdb -in test.fa -dbtype nucl -out test

# 比对
blastn -query b.fasta -db test -outfmt 6 -out result

2. 比对结果输出

因为blast的结果输出有很多格式，这里以最常用的6格式来介绍

query_id	refer_id	identity	alignment_length	mismatches	gap_openings	q.start	q.end	s.start	s.end	e-value	bit_score
BA000030.4	CP023202.1	78.25	1209	226	26	15813	17004	7017078	7018266	0	741
BA000030.4	CP016438.1	75.15	4363	967	102	26097	30398	6410499	6414805	0	1943
BA000030.4	CP023692.1	71.89	3163	704	141	26098	29169	4386693	4389761	0	745
BA000030.4	CP033073.1	76.29	3108	642	77	26105	29169	2959523	2956468	0	1568
BA000030.4	CP060828.1	74.8	2936	661	63	26157	29058	5940668	5937778	0	1249
BA000030.4	CP016279.1	76.88	3032	631	63	26168	29170	9144413	9147403	0	1652
BA000030.4	CP034539.1	73.95	2349	521	77	26241	28542	2852251	2849947	0	863
BA000030.4	CP033073.1	84.84	2164	307	16	29270	31427	3675813	3677961	0	2159

3. 结果详解

总共对应12列结果，每一列的含义如下：

query id：查询序列ID标识;

refer id：参考序列ID标识;

identity (%)：序列比对的一致性百分比;

alignment length：符合比对的比对区域的长度;

mismatches：比对区域的错配数;

gap openings：比对区域的gap数目;

q.start：比对区域在查询序列(query id)上的起始位点;

q.end：比对区域在查询序列(query id)上的终止位点;

s.start：比对区域在参考序列(refer id)上的起始位点;

s.end：比对区域在参考序列(refer id)上的终止位点;

e-value：比对结果的期望值，将比对序列随机打乱重新组合，和数据库进行比对，如果功能越保守，则该值越低；

bit score：比对结果的bit score值;