CNVnator
CNVnator是一款CNV检测软件,通过对全基因组测序数据进行分析来预测CNV。拷贝数变异(Copy Number Variation,CNV)是基因结构变异(StructuralVariant,SV)的重要组成部分,由基因组发生重排而导致, 一般指长度为1 kb以上的基因组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复。
CNVnator相关使用方法来啦!!!
一、安装
1)通过docker镜像安装:
docker pull diploid/cnvnator
2)从github安装
gitclone https://github.com/abyzovlab/CNVnator.git
cdCNVnator
ln-s /path/to/src/samtools samtools
make
二、软件使用
注意:CNVnator中依赖 ROOT 这个软件包,这个软件包是专门针对大数据的处理进行开发的,提供了统计分析,可视化,数据存储等一系列功能,基于这个体系可以极大的加快运行速度,所以将原始的信息都存在root文件中,便于分析.
1)准备文件:sam/bam文件,参考基于组及其索引文件
2)EXTRACTING READ MAPPING FROM BAM/SAM FILES
cnvnator-rootfile.root-treetest.bam-chrom 1
参数说明:
-root : 指定输出 ROOT 文件
-chrom : 指定染色体名称
-tree : 指定 bam 文件名
3)GENERATING A READ DEPTH HISTOGRAM
cnvnator-rootfile.root-his 10 -dgenome.dir
参数说明:
-his : 指定窗口的大小,单位为bp
-d : 参考基因组fasta文件所在的目录
4)CALCULATING STATISTICS
cnvnator -root file.root -stat 10
参数说明:
-stat: 指定窗口的大小,和第二步的 -his 参数的取值相同。
5)RD SIGNAL PARTITIONING
cnvnator-rootfile.root-partition 10
参数说明:
-partition: 指定窗口的大小,和第二步的 -his 参数的取值相同。
6)CNV CALLING
cnvnator-rootfile.root-call 10 > cnv.call.txt
参数说明:
-call : 指定窗口的大小,和第二步的 -his 参数的取值相同,
三、结果
第一列为CNV的类型,包括了deletion和duplication两种类型
第二列为CNV的染色体区域
第三列为CNV的长度,第四列为归一化之后的read depth, 归一化到0-1的范
第五列到第八列为不同的evalue值,最后一类为q0