![2ae0fb007f5bb7bc174636be56e081c6.png](https://i-blog.csdnimg.cn/blog_migrate/75d78b75da5f445088c8d28d6ef3eb2e.jpeg)
结构变异成为越来越多研究关注的热点,如何检测基因组范围内的结构变异? 目前主要检测方法分为以下几种:
·基于二代短读测序的结构变异检测
·基于三代长读测序的结构变异检测
·基因组从头组装结构变异检测
·基于RNA数据(转录组数据)的结构变异检测
·基于10x genemics、HiC等新技术的结构变异检测
在不考虑组装的情况下,基于二代测序数据的检测方法主要是
RP(read pair),RD(read depth),SR(split read)三种,检测原理这篇文章已经说的很详细(《 一篇文章说清楚基因组结构性变异检测的方法》 作者: 黄树嘉https://zhuanlan.zhihu.com/p/40290546 ),这里简单介绍几个代表软件。
·BreakDancer : 基于RP方法,根据pair reads在参考基因组上的的映射距离和方向,将每个读取对象分类为normal或SV,然后识别出符合SV类别的读取次数较多的区域,并分配一个置信度得分,然后输出到结果文件中。 它的缺点是可能导致遗漏一些较小的缺失,只要其长度在RP片段的正常可变范围内。
·DELLY : 基于RP和SR方法提高了断点预测的准确性,并允许检测较小的删除(20+bp);
·LUMPY : 将覆盖信息(覆盖度、深度等)集成为一种输入信号,同时使用RP,SR,RD进行联合分析。 上述软件专门用于检测某些特定类型的变异,但没有一种能够可靠地识别所有SV类型和大小范围。 以
MetaSV,Parliament2,SURVIVOR为代表的meta-
methods 通过组合来自不同工具的调用并选择由多个方法标识的变体来填补这一空白。 理想情况下,meta-methods可以结合多种方法的优点,同时克服它们各自的缺点; 但实际上这些软件的假阳性率很高,无法可靠地识别大的插入,同时有相当多的复杂变异被忽略。