生成mysql nt文件_linux下安装blast并创建nt数据库

BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。BLAST是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。Blast 是一个序列相似性搜索的程序包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。比如说查询的序列为核酸,查询数据库亦为核酸序列数据库,那么就应该选择blastn程序。

安装blast

#下载blast软件包选择2.7.1版本

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.7.1+-x64-linux.tar.gz

#解压到pkgs文件夹中

tar –zxvf ncbi-blast-2.7.1+-x64-linux.tar.gz –C /YZGROUP1/GYROTECH/Bioinfo-Dept/pkgs/

#文件夹重命名为ncbi-blast

mv ncbi-blast-2.7.1+ ncbi-blast

#将软件配置环境变量

echo ‘PATH=/YZGROUP1/GYROTECH/Bioinfo-Dept/pkgs/ncbi-blast/bin:$PATH’ >> ~/.bashrc

#刷新.bashrc文件,环境变量生效

source ~/.bashrc

#验证软件是否安装成功

blastn -version

创建nt数据库

#创建blast_db文件夹

mkdir ./blast_db && cd ./blast_db

#下载nt.gz(核酸数据库)以及md5文件

wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nt.gz

wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nr.gz.md5

#生成md5

md5sum nt.gz

#解压nt.gz文件

gunzip nt.gz

#建立索引步骤放在后台运行,考虑避免建库出现错误,添加了-logfile 参数,记录建库的过程。

nohup makeblastdb -in nt -parse_seqids -hash_index -dbtype nucl -logfile nt_logfile &

除上述创建方法,也可以直接下载https://ftp.ncbi.nih.gov/blast/db/路径下nt.*.tar.gz,然后进行解压,最后在家目录中创建.ncbirc文件,该文件是NCBI BLAST全局配置文件,写入以下内容:

; Start the section for BLAST configuration

[BLAST]

; Specifies the path where BLAST databases are installed

BLASTDB= /YZGROUP1/GYROTECH/Bioinfo-Dept/HumanProject/blast_db/

; Specifies the data sources to use for automatic resolution

; for sequence identifiers

DATA_LOADERS=blastdb

; Specifies the BLAST database to use resolve protein sequences

BLASTDB_PROT_DATA_LOADER=/YZGROUP1/GYROTECH/Bioinfo-Dept/HumanProject/blast_db/nr

; Specifies the BLAST database to use resolve protein sequences

BLASTDB_NUCL_DATA_LOADER=/YZGROUP1/GYROTECH/Bioinfo-Dept/HumanProject/blast_db/nt

BATCH_SIZE=10G

; Windowmasker settings

[WINDOW_MASKER]

WINDOW_MASKER_PATH=/db/home/shenwei/data/blast/windowmasker

; end of file

程序名

查询序列

数据库

搜索方法

Blastn

核酸

核酸

核酸序列搜索逐一核酸数据库中的序列

Blastp

蛋白质

蛋白质

蛋白质序列搜索逐一蛋白质数据库中的序列

Blastx

核酸

蛋白质

核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索

Tblastn

蛋白质

核酸

蛋白质序列和核酸数据库中的核酸序列6框翻译后的蛋白质序列逐一比对

TBlastx

核酸

核酸

核酸序列6框翻译成蛋白质序列,再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux系统下安装和使用BLAST(Basic Local Alignment Search Tool)可以按照以下步骤进行: 1. 安装依赖项:首先,确保您的系统已经安装了必要的依赖项,包括gcc编译器、make工具和zlib库。您可以使用包管理器(如apt、yum或dnf)来安装这些依赖项。例如,在Ubuntu系统上,可以使用以下命令进行安装: ```shell sudo apt update sudo apt install build-essential zlib1g-dev ``` 2. 下载BLAST软件包:访问NCBI BLAST官方网站(https://blast.ncbi.nlm.nih.gov/Blast.cgi)并下载适用于Linux系统的BLAST软件包。您可以选择下载预编译的二进制文件或源代码。 3. 解压缩文件:如果您下载的是预编译的二进制文件,解压缩下载的文件。如果您下载的是源代码,则需要解压缩并进入解压后的目录。 4. 配置和编译:打开终端,进入解压后的BLAST目录,并运行以下命令来配置和编译BLAST: ```shell ./configure make ``` 5. 安装:运行以下命令以root权限安装BLAST: ```shell sudo make install ``` 6. 设置环境变量:为了能够在终端中随时使用BLAST命令,您需要将BLAST可执行文件所在的路径添加到系统的PATH环境变量中。您可以编辑~/.bashrc文件并在其中添加以下行(假设您安装的是blast+软件包): ```shell export PATH="/path/to/blast+/bin:$PATH" ``` 替换"/path/to/blast+"为您实际安装BLAST软件包的路径。 7. 验证安装:重新启动终端或运行`source ~/.bashrc`使环境变量生效。然后,尝试运行以下命令来验证BLAST是否成功安装: ```shell blastn -version ``` 如果成功安装,将显示BLAST软件的版本信息。 现在您已经成功安装BLAST。您可以使用各种BLAST命令(如blastn、blastp等)来执行不同类型的序列比对和搜索操作。请参考BLAST官方文档以了解更多关于使用BLAST的详细信息和示例。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值