对于公司送回来的测序数据,我们通常需要进行质检,检查数据是否符合我们要求的测序深度,在质检中,统计各个位点的depth就显得尤为重要。
最常见的统计depth的方法就是使用samtools depth,但是这个方法仅仅局限于对单个位点进行depth进行统计,那么有时候我么你需要使用滑动窗口来对区间进行统计,这样可以观察在整条染色体上测序深度的变化趋势,从而发现已经问题,比如CNV等,这个时候我推荐另一种方法bedtools coverage.
具体使用方法:
1. bedtools makewindows -g genome.txt -w 10000000 -s 1000000 > windows.bed
#bedtools makewindows用来自动生成划窗区间。-g genome.txt是要划分的基因组,格式为两列:染色体、染色体长度;-w 10000000为窗口大小为10M;-s 1000000为步长为1M,即窗口在染色体上每次向右平移1M的距离;windows.bed为输出文件,格式为三列:染色体、区间开始位点、区间结束位点。
2. bedtools coverage -a windows.bed -b xxx.sort.bam > xxx.depth.txt
#bed