欢迎关注”生信修炼手册”!
通过SNP芯片来检测CNV,对应的分析软件有很多,PennCNV就是其中之一,该软件通过隐马可夫模型来检测CNV, 官网如下
http://penncnv.openbioinformatics.org/en/latest/
数据分析的pipeline示意如下
首先我们需要准备signal intensity file, 该文件用来记录每个位点对应的LRR和BAF两个统计值,有两种格式,第一种格式示意如下
\t
分隔的6列,第一列为SNP的名称,第二列为snp位点所在的染色体名称,第三列为snp位点所在的染色体位置,第四列为该位点的分型结果,第五列为LRR统计值,第六列为BAF统计值,对于cnv calling而言,最重要的是Name, LRR, BAF这3列的值,所以该文件还可以有第二种格式,示意如下
其次需要芯片平台对应的HMM和PFB文件,在软件的安装目录自带了部分芯片对应的这两种文件。PFB是population frequency of