从bam文件的内容来学习Phred quality score /QUAL/Cigar/等常用概念

本文介绍了BAM文件中的关键概念,包括查询序列名称(QNAME)、FLAG、比对质量值(MAPQ)、CIGAR字符串以及碱基质量(QUAL)。通过详细解释每个字段的含义,如FLAG中的比对状态,CIGAR表示的序列匹配模式,以及Phred Quality Score与碱基判断错误概率的关系,帮助读者深入理解NGS数据的比对信息。
摘要由CSDN通过智能技术生成

参考文献:

sam文件详解 https://genome.sph.umich.edu/wiki/SAM

mapping quality的算法 https://genome.sph.umich.edu/wiki/Mapping_Quality_Scores

博客参考 https://blog.csdn.net/xcaryyz/article/details/79257604

首先看一下,在bam文件中常用的一些列名称

QNAME:这里指得是查询序列的名称,也就是我们的reads名称

FLAG: 以10进制或者16进制数的形式来代表一些比对的意义,如下图所示,,2代表完全匹配,4代表没有匹配,16代表反向匹配,1024代表duplicate,而这些数字是可以相加的,例如2+1024是1026,代表完全匹配但是是个duplicate

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值