samtools flagstat命令简介:
统计输入文件的相关数据并将这些数据输出至屏幕显示。每一项统计数据都由两部分组成,分别是QC pass和QC failed,表示通过QC的reads数据量和未通过QC的reads数量。以“PASS + FAILED”格式显示。还可以根据samtools的标志位显示相应的内容,但是这里不做讨论。
命令格式:
samtools flagstat <in.bam> |<in.sam> | <in.cram>
运行flagstat命令得到的结果如下图所示:
从第一行至第十一行分别表示:
1. QC pass的reads的数量为2499917,未通过QC的reads数量为0,意味着一共有2499971条reads;
2. 重复reads的数量,QC pass和failed
3. 比对到参考基因组上的reads数量;
4. paired reads数据数量;
5. read1的数量;
6. read2 的数量;
7. 正确地匹配到参考序列的reads数量;
8. 一对reads都比对到了参考序列上的数量,但是并不一定比对到同一条染色体上;
9. 一对reads中只有一条与参考序列相匹配的数量;
10. 一对reads比对到不同染色体的数量;
11. 一对reads比对到不同染色体的且比对质量值大于5的数量
https://blog.csdn.net/u013553061/article/details/53402232?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160173025819195264714691%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=160173025819195264714691&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v3~pc_rank_v2-2-53402232.first_rank_ecpm_v3_pc_rank_v2&utm_term=samtools+flag&spm=1018.2118.3001.4187