首先我们来认识几个词汇:
- NIH(National Institutes of Health)美国国立卫生研究院;
- NLM(National Library of Medicine)美国国立医学图书馆;
- NCBI (National Center for Biotechnology Information)美国国立生物技术信息中心。
由于意识到信息计算机化过程方法对指导生物医学研究的重要性,美国参议员 Claude Pepper 发起了在 1988 年 11 月 4 日建立国立生物技术信息中心(NCBI)的立法。
隶属关系如下:NCBI 是在 NIH 的 NLM 的一个分支。
- BLAST(Basic Local Alignment Search Tool)):生物信息学研究中经常需要进行序列比对,BLAST 是传统的序列比对工具,可以在蛋白质数据库或 DNA 数据库中进行相似性的比较分析;
- NCBI-BLAST:NCBI 提供的 BLAST 2.0,和最初的 BLAST 相比,已经可以处理有缺口的比对序列了;
随着生物序列数据的快速增长,大批量序列比对变得极为耗时,近年来开始利用 GPU 加速生物序列比对,许多传统的序列比对工具和算法都在 GPU 上得以移植实现。
- GPU-BLAST:可以调用 GPU 的 BLAST 程序;
参考官网 GPU-BLAST 的安装和使用文档,本文详细描述了在 Centos7.0 系统部署 GPU-BLAST 的步骤,并且运行了样例程序,在 K80 平台体验了 GPU-BLAST 的加速效果。
1. 安装 Centos7.0;
可参考 Centos 7.0 (1) 安装。
2. 安装 nvidia 显卡驱动;
可参考 Centos 7.0 (7) 安装 nvidia 显卡驱动。
3. 安装 CUDA;
安装CUDA7.5。
详细安装过程请见附录。
4. 安装GPU-BLAST;
安装 GPU-BLAST 有两种方法。其一是分步安装,先安装 NCBI-BLAST,再安装 GPU-BLAST;其二是同时安装。我们来详细描述方法一的安装。
1)安装 NCBI-BLAST
建立一个工作目录,进入该目录。我们的工作目录是 /root/blast。
# wget ftp://ftp.ncbi.nlm.nih.gov/blast/executa