先将二代测序的下机数据转化为fastq格式,可以然后比对到参考基因组得到sam文件,再将sam文件转化为排序好的bam文件,利用samtools软件就可以求出数据的测序深度
samtools view -bS *.sam > *.bam
samtools sort *.bam -o *.sorted.bam
samtools depth *.sorted.bam > *.depth.txt
输出文件的含义是:第一列是染色体名,第二列是染色体位置,第三列是对应位点的覆盖层数(即测序深度),如下图:
cut -f3 *.depth.txt | sort | uniq -c | sort -nr -k1
输出文件的含义为:【29844382 1】表示——测序深度为1的有29844382个位点,如下图: