转载：教程：在NCBI批量Blast

最新推荐文章于 2025-02-28 11:19:58 发布

morningCV

最新推荐文章于 2025-02-28 11:19:58 发布

阅读量1.9w

点赞数

分类专栏：生物

生物专栏收录该内容

27 篇文章

订阅专栏

本文全文转载子云生物：http://yunbio.com/49

先要多谢一下 Sophie 与 rebeccajiejie 的热心，让云生物看起来着实有些了活力。也希望更加的人参与进来回答问题。得开始认真宣传一下才行啊。

最近Sophie问了我关于批量Blast的问题。我尝试了一下NCBI的批量Blast，感觉非常不错。写个教程分享一下。拿水稻的序列Blast做个例子。

Batch entrez

Batch entrez（http://www.ncbi.nlm.nih.gov/sites/batchentrez）是NCBI提供的批量搜索entrez数据库的工具。非常好用的。

比如说你有一个大量的accession或是gi的list（在文件里一行一个）。如下：

NM_016618

NM_022735

NM_023935

NM_022047

NM_004395

打开Batch entrez，载入这个文件。

如上图所示，选择一个文件。选择一个数据库。然后按Retrieve。

批量下载Fasta序列

在以一步之后，进入结果页面。在Display选择Fasta，然后再在send to 里选择send to File。这样就完成了批量下载 Fasta序列了。

在NCBI批量Blast

上一步下载好的Fasta序列文件sequence.fasta先保留。打开Blast界面，http://blast.ncbi.nlm.nih.gov/Blast.cgi。选择需要的物种的Blast程序。

上面已经说了拿水稻的做为例子。如下图所示，在choose a file to upload里选择刚刚下载好的Fasta文件。其它参数按需要选择。

点Begin Search后，会进下如下图的界面。在Show Alignment as 里选择 Plaing text（默认为html格式）。在Alignment View一栏选择Hit Table（即相当于在Blast选择-m9的参数）。

选择Hit table后，返回的结果有12列，依次是：

query id query的ID

subject ids 比对到的ID

% identity 相似性（%）

alignment length 比对到的长度

mismatches 相对而言的，在alignment length中有多少个没有匹配，即PM

gap opens 同上，在alignment length中有多少个gap

q. start query序列比对的开始

q. end query序列比对的结束

s. start subject序列比对的开始

s. end subject序列比对的结束

evalue E值

bit score 比对的得分

上面选择完了之后，点击View report就可以查看结果了。如果数据太大，需要等一等。

返回的结果已经是清晰明了的。再把结果导入到Excel做一些筛选工作就行了。这就不讲了。

NCBI批量Blast 完~ 欢迎大家多写点文章来投稿啊。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。