BWA mem比对的 Secondary ,Supplementary alignment 和 -M -Y参数

作者:青萍,你好

出处:https://www.cnblogs.com/timeisbiggestboss/p/8856888.html

1.supplementary alignment

supplementary alignment是指一条read的一部分和参考区域1比对成功,另一部分和参考区域2比对成功,参考区域1和参考区域2没有交集(或很少),那么一条read就会产生两条sam文件,

将其中的一条sam文件作为represent alignment,而另一条作为supplementary alignment (flag为2048)。

d66b75a042b191e1dadf558133c2d94c.png

将上面的fastq文件去跑bwa,read有两条sam文件,第二条的flag值为2048:

53ba2b7fd3b40ede87a3936941b0f614.png

2.bwa mem的-M -Y参数:

-M:mark shorter split hits as secondary。就是把supplemenary alignment 变为no primary(flag值256) 。下面是bwa mem -M的结果

4acd434ff9fef13693f74833dc6ad4cc.png

-Y:use soft clipping for supplementary alignments。把默认的hard clip变为soft clip。hard clip 不会显示不匹配的碱基串,soft clip会显示不匹配的碱基串。下面是bwa mem -Y的结果(58H34M变为58S34M)

0e0795c4be430b57b4ffc02286815812.png

3.secondary(no primary)是指这条read在基因组上有多个匹配区域(>=2),可以是read的同一部分有不同匹配区域,也可以是一条read上的不同区域。所以supplemenary aligment应该算是secondary的子集。

许多处理bam的软件不会去处理supplemenary(split alignments),比如Picard’s markDuplicates,所以可能需要用-M把supplemenary 转换为secondary。

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

  • 联系方式

    QQ交流群(免费):925694514

    微信交流群(免费):加微信好友,注明“Galaxy交流群”

    客服微信:usegalaxy

a779e32ed38b4e4f2d35f61968d9abdd.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《基于GPU的BWA序列比对算法分析与加速》是一篇研究基于图形处理器(GPU)加速BWA序列比对算法的论文。BWA是一种常用的高通量测序数据比对算法,用于将测序数据与参考基因组进行比对。然而,BWA算法处理大规模测序数据时存在计算量大、性能低下等问题。因此,该论文探索了基于GPU的加速算法,旨在提高BWA算法的计算效率。 论文首先分析了BWA算法的思想,包括Seed-and-Extend方法和BWT索引结构。然后介绍了GPU的并行计算架构和CUDA编程模型,指出了GPU在并行计算方面的优势。 接着,该论文提出了一种基于GPU的BWA算法优化方案。通过将算法的计算任务划分为多个并行任务,在GPU上并行执行,可以大大提高计算效率。同时,为了减小数据传输的开销,该论文使用了一种基于shared memory的优化策略,将数据存储在GPU内存中,减少了与主机内存之间的数据传输。 为了验证提出的加速算法的效果,论文进行了大量的实验,并比较了加速算法和传统算法在性能方面的差异。实验结果表明,基于GPU的BWA算法能够大幅度提高比对速度和计算效率,尤其是在处理大规模测序数据时表现更加突出。 综上所述,《基于GPU的BWA序列比对算法分析与加速》论文通过研究基于GPU的加速算法,有效地优化了BWA序列比对算法的性能。该研究对于加速大规模测序数据的处理具有重要的实际意义,可以为基因组学和生物信息学领域的研究提供更快速、高效的测序数据比对工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值