1 概述
Bowtie2 是将测序reads与长参考序列比对工具,适用于将长度大约为50到100或1000字符的reads与相对较长的基因组(如哺乳动物)进行比对。Bowtie2使用FM索引(基于Burrows-Wheeler Transform 或 BWT)对基因组进行索引,以此来保持其占用较小内存。对于人类基因组来说,内存占用在3.2G左右。Bowtie2 支持间隔,局部和双端对齐模式。可以同时使用多个处理器来极大的提升比对速度。详细介绍见官网链接https://bowtie-bio.sourceforge.net/bowtie2/index.shtml。
2 安装准备
2.1 操作系统环境
版本信息:KeyarchOS 5.8sp1
硬件平台:X86_64
2.2 Bowtie2版本
Bowtie2-2.3.4.1
https://bowtie-bio.sourceforge.net/bowtie2/index.shtml
厂商名称:Johns Hopkins University
3 安装
3.1 安装Python
python3.8(已经在KOS AppSteam仓库发布),可以通过yum install直接安装。
yum install python38
安装完成后添加python3-python的软连接:
ln -s /usr/bin/python3 /usr/bin/python
3.2 安装Bowtie2
1、下载安装包
sudo wget https://jaist.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip
解压后进入安装目录
unzip bowtie2-2.3.4.1-linux-x86_64.zip
2、进入解压文件夹,测试bowtie2是否安装成功:
cd bowtie2-2.3.4.1-linux-x86_64/
./bowtie2
3.3 配置Bowtie2
在bashrc配置文件中配置bowtie2相关指令:
vim ~/.bashrc
source ~/.bashrc使配置文件即刻生效
配置生效后,在任何路径下都可启动bowtie2:
4 运行Bowtie2
4.1 构建参考基因组索引
1、下载索引文件
wget http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/chromFa.tar.gz
2、解压索引文件
tar -zxvf chromFa.tar.gz
3、将所有fa格式的文件都合并到mm10.fa后构建索引mm10:
cat *.fa > mm10.fa
bowtie2-build mm10.fa mm10
4.2 单末端测序
使用单末端测序示例文件reads_1.fq,生成example.sam:
bowtie2 -p 6 -3 5 --local -x mm10 -U /home/zhu/bowtie2-2.3.4.1-linux-x86_64/example/reads/reads_1.fq -S example.sam