【注:笔记于2019年10月6日记录在OneNote里的,现在把它们迁移到CSDN里。】
1.配置环境:Ubuntu18.04
2.下载BLAST软件到本地桌面
在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATESET/下下载安装包:ncbi-blast-2.9.0+-x64-linux.tar.gz。
注:或者通过wget直接下载到服务器指定的目录
3.解压到本地桌面
4.通过Xftp在 /usr/local/ 目录下新建文件夹 blast
5.通过Xftp将解压后的安装包拷贝到blast目录下
6.添加环境变量:
(1)通过Xshell打开终端,切换为root用户,执行 vim /etc/profile 打开编辑文件,在末尾添加:
export PATH=/usr/local/blast/bin:$PATH
保存退出。若此处执行成功,执行 blastn -version会出现版本信息。
(2)若不成功,切换到根目录,执行 vim /etc/environment ,在末尾添加:
:/usr/local/blast/bin
保存退出,在执行一遍 blastn -version。
7.准备装各种数据库的文件夹:
(1) 在目录/usr/local/blast/下新建一个一个文件夹命名为db;
(2)在 /usr/local下新建一个文件,命名为.ncbir(注:文件名是以点开头的)。
(3)切换到 /usr/local下,执行 vim .ncbir,在文件中添加如下内容:
[BLAST]
BLASTDB=/usr/local/blast/db
8.下载FASTA格式的数据库:(下载到本地解压,然后将文件上传到/usr/local/blast/db目录下)
(1)在uniprot官网上下载uniprot_sprot数据库
(2)下载FASTA格式的数据库: ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/
例如:下载nr.gz、nt.gz( 文件很大!很大!很大!解压之后更大!更大!更大!)
9. 建立BLAST+可用的数据库:
打开终端(Terminal),切换到/usr/local/blast/db目录下:
(1)执行下面的命令(以蛋白质库nr为例)安装nr库:
makeblastdb –in nr -parse_seqids -hash_index -dbtype prot
注:若要安装nt库,就将 nr改为 nt
(2)执行下面的命令安装uniprot库(具体操作请参考下一篇笔记)
makeblastdb –in ./uniprot_sprot.fasta -parse_seqids -hash_index -dbtype prot
10. 使用程序,如使用psiblast:
在目录/usr/local/blast/下新建3个文件夹,分别命名为pssm,input,output
设待查询序列所在文件的名字为a.fasta(一个文件放一条序列,且必须为fasta格式)
执行命令:
psiblast -comp_based_stats 1 -evalue 0.001 -num_iterations 3 -db swissprot -query input/a.fasta -out output/a.txt -out_ascii_pssm pssm/a.pssm
注:/表示的路径,根据自己所安装的数据所在位置填写,不是固定的