安装本地blast序列比对软件,我们可以搜索一个查询序列定制数据库,例如想研究一个新测序的基因组,或者感兴趣的一组蛋白质序列。有时我们希望把程序插入到一个流程中,例如搜索一个大量的查询序列,例如你的测序数据含有大量的污染片段,你想知道这些片段比对到了什么物种。
blast软件安装
从NCBI下载安装包https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/。下载2.11.0 linux版本,下载并解压,解压之后BLAST就安装好了。用户需要设置环境变量,目的是为了告诉系统在那里可以找到安装好的BLAST软件。
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.11.0+-x64-linux.tar.gz
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.11.0+-x64-linux.tar.gz.md5
md5sum -c ncbi-blast-2.11.0+-x64-linux.tar.gz.md5
tar -zxvf ncbi-blast-2.11.0+-x64-linux.tar.gz
#加入到环境变量
export PATH=$PATH:$PWD/ncbi-blast-2.11.0+/bin
nt/nr fasta下载
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.