生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2

1. bwa-mem2简介

工具bwa-mem2是bwa(李恒开发)bwa-mem算法的下一个版本, 由英特尔并行计算实验室的Vasimuddin Md和Sanchit Misra开发完成的,相比于bwa-mem速度快1.3-3.1倍,还极大降低了内存和存储使用量。

目前bwa-mem比对算法广泛运用在在临床WES/WGS/CNV-seq/NIPT等项目中,用于将clean fastq比对到人类hg19/hg38参考基因组。

bwa github: https://lh3.github.io/2018/04/02/minimap2-and-the-future-of-bwa

bwa-mem2 github: https://github.com/bwa-mem2/bwa-mem2

2. 测试数据集(bwa-mem VS bwa-mem2)

比较了bwa-mem和bwa-mem2在D1-D4数据集上单端SE和双端PE数据的比对所消耗的时间,bwa-mem2速度均有一定比例的提升。

PE数据表现

SE数据表现

3. bwa-mem2安装

# 使用预编译的二进制版本(推荐)
# 下载解压
curl -L https://github.com/bwa-mem2/bwa-mem2/releases/download/v2.2.1/bwa-mem2-2.2.1_x64-linux.tar.bz2 | tar jxf -

cd bwa-mem2-2.2.1_x64-linux 

# 加入环境变量
echo "export PATH=$(pwd):PATH" >> ~/.bashrc
source ~/.bashrc

# 查看帮助信息
bwa-mem2

Usage: bwa-mem2 <command> <arguments>
Commands:
  index         create index
  mem           alignment
  version       print version number

4. 基本用法

使用方法与BWA MEM工具完全相同。

# 构建参考序列索引
bwa-mem2 index ref.fa
samtools index ref.fa

# 双端fastq比对
bwa-mem2 mem -t 10 ref.fa read1.fq read2.fq > out.pe.sam

# 单端fastq比对
bwa-mem2 mem -t 10 ref.fa read1.fq > out.se.sam

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

生信软件2 - 下游比对数据的统计工具 picard

生信软件3 - mapping比对bam文件质量评估工具 qualimap

生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

生信软件5 - RIdeogram包绘制染色体密度图

生信软件6 - bcftools查找指定区域的变异位点信息

生信软件7 - 多线程并行运行Linux效率工具Parallel

生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计

生信软件9 - 多公共数据库数据下载软件Kingfisher

生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa

生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV

生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )

生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计

生信软件14 - bcftools提取和注释VCF文件关键信息

生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

生信软件16 - 常规探针设计软件mrbait

生信软件17 - 基于fasta文件的捕获探针设计工具catch

生信软件18 - 基于docker部署Web版 Visual Studio Code

生信软件19 - vcftools高级用法技巧合辑

生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑

生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump

生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle

生信软件23 - Samtools和GATK去除PCR重复方法汇总

生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download

生信软件25 - 三代测序数据灵敏比对工具ngmlr

更多内容请关注公众号【生信与基因组学】,定期更新生信算法和编程、基因组学、统计学、分子生物学、临床检测和深度学习等内容。

  • 28
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信与基因组学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值