如何判断基因组的重复区域_重磅综述 | 基因组结构变异检测原理及方法

本文综述了基因组结构变异的检测方法,包括基于二代、三代测序,从头组装,以及RNA数据的检测手段。讨论了BreakDancer、DELLY、LUMPY等工具的优缺点,并指出三代测序在检测重复区域的优势。RNA-seq方法主要用于基因融合检测。还探讨了10x Genomics linked reads和Hi-C等新技术在结构变异检测中的应用。
摘要由CSDN通过智能技术生成
2ae0fb007f5bb7bc174636be56e081c6.png 结构变异成为越来越多研究关注的热点,如何检测基因组范围内的结构变异? 目前主要检测方法分为以下几种: ·基于二代短读测序的结构变异检测 ·基于三代长读测序的结构变异检测 ·基因组从头组装结构变异检测 ·基于RNA数据(转录组数据)的结构变异检测 ·基于10x genemics、HiC等新技术的结构变异检测 在不考虑组装的情况下,基于二代测序数据的检测方法主要是 RP(read pair),RD(read depth),SR(split read)三种,检测原理这篇文章已经说的很详细(《 一篇文章说清楚基因组结构性变异检测的方法》 作者: 黄树嘉https://zhuanlan.zhihu.com/p/40290546 ),这里简单介绍几个代表软件。 ·BreakDancer : 基于RP方法,根据pair reads在参考基因组上的的映射距离和方向,将每个读取对象分类为normal或SV,然后识别出符合SV类别的读取次数较多的区域,并分配一个置信度得分,然后输出到结果文件中。 它的缺点是可能导致遗漏一些较小的缺失,只要其长度在RP片段的正常可变范围内。 ·DELLY : 基于RP和SR方法提高了断点预测的准确性,并允许检测较小的删除(20+bp); ·LUMPY : 将覆盖信息(覆盖度、深度等)集成为一种输入信号,同时使用RP,SR,RD进行联合分析。 上述软件专门用于检测某些特定类型的变异,但没有一种能够可靠地识别所有SV类型和大小范围。 以 MetaSV,Parliament2,SURVIVOR为代表的meta- methods 通过组合来自不同工具的调用并选择由多个方法标识的变体来填补这一空白。 理想情况下,meta-methods可以结合多种方法的优点,同时克服它们各自的缺点; 但实际上这些软件的假阳性率很高,无法可靠地识别大的插入,同时有相当多的复杂变异被忽略。
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值