BLAST介绍
BLAST(Basic Local Alignment Search Tool)是一套在蛋白数据库或DNA数据库中进行相似性比较的分析工具。BLAST采用局部比对的算法,能够寻找到序列之间的局部相似区域。BLAST将核酸或蛋白序列与序列数据库进行比较,计算匹配的统计学意义。BLAST也常用于推测序列间的功能和进化关系,从而帮助识别基因家族成员。
主页链接:BLAST: Basic Local Alignment Search Tool
本地化实现
在一些情况下我们希望实现BLAST的本地化,构建自定比对库或实现大数据量的比对已满足自身的分析需求。下面我们将以Ubuntu平台实现BLAST本地化为例来进行演示。
Ubuntu作为世界上最流行的Linux系统之一,其开源和易安装的特点非常适用于初次使用Linux的小白(个人觉得),并且win10支持安装ubuntu的子系统,无需安装虚拟机,可以说非常方便了,具体的安装过程我后续会写一篇文章来讲解。
废话不多说我们开整。
首先我这里整理了两种方式来安装BLAST:
1)通过apt命令,此方式的优点是操作简便,也无需手动配置环境变量
$ apt install ncbi-blast+
2)去官方下载安装包进行安装,该方法优点是可自定义安装位置,且选择性配置环境变量,缺点是过程比较繁琐。
下载链接:Index of /blast/executables/blast+/LATEST
选择对应的linux版本
直接在网页上下载或右键复制链接后使用wget命令下载
# 创建目录
$ mkdir for_blast
$ cd for_blast
$ wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.13.0+-x64-linux.tar.gz
# 解压缩
$ tar -xzvf ncbi-blast-2.13.0+-x64-linux.tar.gz
解压缩后如果我们没有将bin文件添加到环境变量,那么如果我们想要使用blast程序,例如blastn,我们就需要进入bin文件下输入以下命令来查看帮助文本,注意要加上 ./
$ ./blastn -h
当然我们也可以选择性的将其添加到环境变量中去:
# 通过修改 .bashrc 文件
$ vim ~/.bashrc
# 在最后一行添加下面一行代码
$ export PATH=/usr/local/for_blast/ncbi-blast-2.13.0+/bin:$PATH # 注意这里的路径应为解压缩后的bin文件路径
# 输入“source ~/.bashrc”命令,立即生效
$ source ~/.bashrc
这样我们就可以在本地实现blast工具了。