欢迎关注”生信修炼手册”!
基于全基因组数据分析CNV, 有以下4种经典策略
read-pair
split-read
read-depth
assembly
每种算法都要其优势和不足之处,综合运用多种策略有助于提高检测的灵敏度,lumpy就是这样一款软件,集合了read-pair,split-read,read-depth, 等多种策略来预测CNV,文章链接如下
https://genomebiology.biomedcentral.com/articles/10.1186/gb-2014-15-6-r84
源代码保存在github上,网址如下
https://github.com/arq5x/lumpy-sv
分析的pipeline示意如下
如图A所示,对于单个样本,综合了read-pair, split-read, read-depth和已知的CNV位点4种信号来预测CNV;如图B所示,对于多个样本,综合多个样本的信号来预测CNV。
lumpy的框架是非常灵活的,扩展性很高,可以将其他分析软件的结果作为输入,比如将cnvnator的输出作为已知CNV的信号。在文章中,将lumpy和其他软件进行了比较,结果如下所示