短序列比对软件——bwa和bowtie2软件

短序列比对软件——bwa和bowtie2软件的安装与使用

写在前面
因使用的是老师提供的账号,无sudo权限,老师已将下列软件提前帮我们安装好了,故安装步骤只提供了代码无上机演示图片
序列文件为老师提前准备好的,直接复制过来使用的,但文中有给出如何自己获取序列文件

1. bwa和bowtie2软件的安装

1.1. bwa的安装

  • BWA,全称Burrows-Wheeler-Alignment Tool,是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。
  • 它有三个不同的算法:
    • BWA-backtrack: 是用来比对 Illumina 的序列的,适合短reads的比对,reads 长度最长能到 100bp。
    • BWA-SW: 支持的长度为 70bp-1Mbp的reads;适用于alignment gap比较频繁的比对。
    • BWA-MEM: 支持的长度为 70bp-1Mbp的reads;对大多数测序数据来说是优选算法。
  • 参考链接:
    • 软件官网:https://bio-bwa.sourceforge.net/
    • manual: https://bio-bwa.sourceforge.net/bwa.shtml

安装

  • 需要sudo权限
  • 输入sudo apt install bwa -y

1.2. bowtie2的安装

1.2.1. apt安装
  • 需要sudo权限
  • 输入sudo apt install bowtie2 -y
1.2.2. conda安装
1.2.3. 预编译安装
  1. 进入想要安装到的目录
    cd Biosofts/
    
  2. 下载Bowtie2的压缩包,并将其解压缩到当前目录
    wget https://zenlayer.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.5.2/bowtie2-2.5.2-linux-x86_64.zip
    unzip bowtie2-2.5.2-linux-x86_64.zip
    
  3. 进入解压后的Bowtie2目录
    cd bowtie2-2.5.2-linux-x86_64/
    
  4. 执行./bowtie2命令
    ./bowtie2
    
    ./bowtie2是Bowtie2的可执行文件名,通过执行该命令,您可以使用Bowtie2进行后续的操作,如比对或建立索引等

2. 运行bwa将read比对到参考基因组

2.1. 命令示例

  1. 创建一个名为bwa_test的目录,并进入该目录。
    mkdir ~/bwa_test -p
    cd ~/bwa_test/
    
  2. 复制GCA_000012525.1_ASM1252v1_genomic.fna文件到当前目录。
    cp /disk1/shares/Seqs/GCA_000012525.1_ASM1252v1_genomic.fna . 
    
    上述文件为老师为我们提供的练习文件,我们自己可以使用wget命令从相应网站获取并解压到当前目录:
    wget ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/012/525/GCA_000012525.1_ASM1252v1/GCA_000012525.1_ASM1252v1_genomic.fna.gz
    gunzip GCA_000012525.1_ASM1252v1_genomic.fna.gz
    
  3. 使用bwa index命令为参考基因组建立索引。
    bwa index GCA_000012525.1_ASM1252v1_genomic.fna -p PCC7942_index
    
    这将为GCA_000012525.1_ASM1252v1_genomic.fna文件建立一个名为PCC7942_index的BWA索引。
  4. 使用bwa mem命令对测序数据进行比对:
    bwa mem PCC7942_index /disk1/shares/Seqs/test_7942raw_1.fq.gz /disk1/shares/Seqs/test_7942raw_2.fq.gz > test_bwa_7942.sam
    
    这将使用BWA对test_7942raw_1.fq.gztest_7942raw_2.fq.gz进行比对,并将比对结果保存到test_bwa_7942.sam文件中。
  5. 使用less命令查看test_bwa_7942.sam文件的内容:
    less test_bwa_7942.sam
    
    这将以分页浏览的方式显示test_bwa_7942.sam文件的内容。可以使用上下方向键进行滚动,按q键退出浏览模式。

2.2. 上机演示

在这里插入图片描述

在这里插入图片描述
使用less命令查看test_bwa_7942.sam文件的内容:
在这里插入图片描述

3. 运行Bowtie2将read比对到参考基因组安装运行

3.1. 命令示例

  1. 创建一个名为"bowtie2_test"的目录,并进入该目录。
    mkdir bowtie2_test
    cd bowtie2_test/
    
  2. 将参考基因组文件GCA_000012525.1_ASM1252v1_genomic.fna复制到当前目录。
    cp /disk1/shares/Seqs/GCA_000012525.1_ASM1252v1_genomic.fna ./  #老师提供的文件,我们可以自己获取
    ll #查看当前目录文件列表
    
  3. 使用bowtie2-build命令为参考基因组建立索引:
    bowtie2-build GCA_000012525.1_ASM1252v1_genomic.fna PCC7942_index
    
    这将为GCA_000012525.1_ASM1252v1_genomic.fna文件建立一个名为PCC7942_index的Bowtie2索引。
  4. 使用bowtie2命令对测序数据进行比对:
    bowtie2 -x PCC7942_index -1 /disk1/shares/Seqs/test_7942raw_1.fq.gz -2 /disk1/shares/Seqs/test_7942raw_2.fq.gz -S test_bowtie2.sam
    
    这将使用Bowtie2对test_7942raw_1.fq.gztest_7942raw_2.fq.gz进行比对,并将比对结果保存到test_bowtie2.sam文件中。
  5. 使用ll命令(或ls -l)来查看当前目录中的文件列表:
    ll
    
    这将显示当前目录中的文件和文件夹的详细信息,包括文件名、大小和权限等。

3.2. 上机演示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4. 比较bwa和bowtie2运行速度

4.1. 命令示例

使用了time命令来测量Bowtie2和BWA的运行时间。

  1. 运行以下命令来使用Bowtie2进行比对:

    time bowtie2 -x PCC7942_index -1 /disk1/shares/Seqs/test_7942raw_1.fq.gz -2 /disk1/shares/Seqs/test_7942raw_2.fq.gz -S test_bowtie2.sam
    

    这将对test_7942raw_1.fq.gztest_7942raw_2.fq.gz进行Bowtie2比对,并将结果保存到test_bowtie2.sam文件中。time命令会输出Bowtie2的运行时间。

  2. 运行以下命令来使用BWA进行比对:

    time bwa mem -t 1 ../bwa_test/PCC7942_index /disk1/shares/Seqs/test_7942raw_1.fq.gz /disk1/shares/Seqs/test_7942raw_2.fq.gz >test_bwa_7942.sam
    

    这将对test_7942raw_1.fq.gztest_7942raw_2.fq.gz进行BWA比对,并将结果保存到test_bwa_7942.sam文件中。同样,time命令会输出BWA的运行时间。
    -t 1选项用于指定线程数,您可以根据需要进行调整。

4.2. 上机演示

在这里插入图片描述

在第一条指令中出现(ERR): "PCC7942_index" does not exist or is not a Bowtie 2 index报错
根据错误信息可知Bowtie2无法找到名为"PCC7942_index"的索引文件。

  1. 首先,确保在当前目录中存在名为"PCC7942_index"的Bowtie2索引文件。如果已经执行了建立索引的步骤,就检查索引文件是否正确生成,并且在当前目录中。
    如果尚未建立索引,您可以尝试重新执行以下命令来建立Bowtie2索引:
    bowtie2-build GCA_000012525.1_ASM1252v1_genomic.fna PCC7942_index
    
    确保参考基因组文件GCA_000012525.1_ASM1252v1_genomic.fna存在,并且位于正确的位置。建立索引过程可能需要一些时间,要等一会儿。建立成功后,可以再次运行Bowtie2比对命令。
  2. 如果问题仍然存在,检查命令中的文件路径是否正确,并确保文件和目录的权限设置正确。
  • 21
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sxx0309

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值