最近接触的数据都是靶向测序,或者全外测序的数据。对数据的覆盖深度及靶向捕获效率的评估成为了数据质量监控中必不可少的一环。
以前都是用samtools depth 算出单碱基的深度后,用perl来进行深度及捕获效率的计算。今天无意中看到了bamdst(https://github.com/shiquan/bamdst)这个软件,用起来也很方便,参考GitHub,在此记录使用方法。
下载并安装:下载安装包并解压后,
cd ./bamdst-master make
安装好后,需要准备.bed文件及.bam文件,以软件提供的MT-RNR1.bed和test.bam为例:
./bamdst-master/bamdst -p ./bamdst-master/example/MT-RNR1.bed -o ./test ./bamdst-master/example/test.bam
输出的结果包含7个文件,为:
-coverage.report -cumu.plot -insert.plot -chromosome.report -region.tsv.gz -depth.tsv.gz -uncover.bed
其中coverage.report提供的信息很多,具体可参照如下:
[Total] Raw Reads (All reads) // All reads in the bam file(s). [Total] QC Fail reads // Reads number failed QC, this flag is marked by other software,like bwa. See flag in the bam structure. [Total] Raw Data(