- 春节过后积压了很多项目,疯狂做项目导致将近半个月没有写博客,这周终于有空进行一些梳理。本次介绍的工具是CNVnator,这个工具是由于Integration Site Analysis项目需要找到插入位点,领导推荐了几个工具,其中就包含CNVnator。
- 下载安装
- 预装依赖包:
- ROOT、samtools、hstlib
- Anacongda/miniconda安装:
conda install cnvnator
- 最方便快捷,如果连接超时,建议单独创建一个环境用于安装cnvnator,可以缩短conda配置环境的时间,避免超时
-
conda create -n cnvnator cnvnator
- 下载安装:
-
git clone https://github.com/abyzovlab/CNVnator.git cd CNVnator ln -s /path/to/src/samtools samtools #这里添加的samtools文件夹是hstlib里面的samtools文件夹路径,不是工具本身的文件夹路径 make
- 配置较为复杂
-
- 两种方式我都尝试过,一般优先考虑第一种,在反复连接超时的情况下不得已下载源码,但是安装时各种报错。主要是工具要求依赖包需要在工具的子目录下,也就是说除了samtools要加软链接,root和hstlib都需要添加,而且还有指定在某个文件夹内,估计是版本升级原因,依赖包的部分文件所在路径发生了变化,增加了很多时间。后来倒回来重新创建了环境,安装cnvnator,终于安装上。
- 预装依赖包:
- 使用步骤
- Extract read mapping
-
cnvnator -root all_sgRNA.root -genome hg38 -tree HspCas9PBsgRNA16_FDSW210056666-1r.bam
- #提取比对后的reads,构建树,该步骤要求执行文件夹内只能有一个root文件,如果在已有一个root文件的基础上重新生成另一个root,哪怕不重名也会报错,另外,可以添加 -chrom 函数指定染色体 如 -chrom 1 2 代表选择1,2号染色体
-
- Generate histogram
-
cnvnator -root all_sgRNA.root -genome hg38 -his 1000 -fasta chr.fa (-fasta可替换-d ref/chr.fa )
- #生成直方图,-his 后面的数值代表最小单位,如果染色体长度有上千万bp,建议选择1000以上。需要注意的是该步骤需要将参考基因组.fa文件置于当前文件夹。之前我参考其他教程使用 -d ref/chr.fa 是会发生报错的。参考博客:CNVnator -his过程中找不到序列
-
- Calculate statistics
-
cnvnator -root all_sgRNA.root -genome hg38 -stat 1000
- #根据直方图频率进行统计,-stat 后的数值必须与-his 相同
-
- Partition
-
cnvnator -root all_sgRNA.root -genome hg38 -partition 1000
- #按照1000bp长度单位进行分割
-
- Call CNVs
-
cnvnator -root all_sgRNA.root -genome hg38 -call 1000 > cnvout.txt
- 变异检测,并输出结果
- Extract read mapping
- 结果展示
- 直接引用结果说明
- 总结,CNV能检测的只有deletion和duplication两种类型,领导认为客户可能还是需要找到insert位点,因此还需要继续尝试其他工具。
2021.3.11丨CNVnator结构变异分析使用方法
最新推荐文章于 2024-02-28 14:30:50 发布