参考文献:
sam文件详解 https://genome.sph.umich.edu/wiki/SAM
mapping quality的算法 https://genome.sph.umich.edu/wiki/Mapping_Quality_Scores
博客参考 https://blog.csdn.net/xcaryyz/article/details/79257604
首先看一下,在bam文件中常用的一些列名称
QNAME:这里指得是查询序列的名称,也就是我们的reads名称
FLAG: 以10进制或者16进制数的形式来代表一些比对的意义,如下图所示,,2代表完全匹配,4代表没有匹配,16代表反向匹配,1024代表duplicate,而这些数字是可以相加的,例如2+1024是1026,代表完全匹配但是是个duplicate