Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测

最新推荐文章于 2021-02-18 09:53:52 发布

wangchuang2017

最新推荐文章于 2021-02-18 09:53:52 发布

阅读量251

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010608296/article/details/103298862

版权

生物信息学同时被 3 个专栏收录

642 篇文章 386 订阅

订阅专栏

170 篇文章 7 订阅

订阅专栏

生信工具Bioinformatics Tools

77 篇文章 40 订阅

订阅专栏

背景

串联重复序列作为基因组重排研究的热点之一，对遗传疾病的遗传背景有着重要的影响。许多用于参考序列串联重复检测的方法获得了高质量的结果。但是，在de novo上下文中，没有可用的参考序列，串联重复检测仍然是一个难题。用第二代测序方法获得的短序列长度不足以跨越包含长重复的区域。这种长度限制是通过第三代测序平台(如太平洋生物科学技术公司)获得的长读来解决的。尽管如此，读取长度的增加伴随着明显的错误率的增加。当前长读研究的主要目标是处理高达16%的高错误率。

方法

在这篇论文中，我们提出了MixTaR，这是第一个串联重复检测的从头开始的方法，它结合了高质量的短读和大长度的长读。我们的混合算法使用一组短读来进行基于de Bruijn图的串联重复模式检测。然后使用长读验证这些模式，并使用局部贪婪程序集构造串联重复序列。结果混合焦油测试与模拟和实际读数从复杂的生物体。为了完整地分析它对错误的鲁棒性，我们使用不同错误率的短读和长读。然后根据检测到的串联重复的数量及其模式的长度对结果进行分析。

结论

该方法具有较高的精度和灵敏度。MixTaR的假阳性率很低，即使是高度错误的读取，它也能够检测出精确的串联重复，模式长度在显著的间隔内变化。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测

背景串联重复序列作为基因组重排研究的热点之一，对遗传疾病的遗传背景有着重要的影响。许多用于参考序列串联重复检测的方法获得了高质量的结果。但是，在de novo上下文中，没有可用的参考序列，串联重复检测仍然是一个难题。用第二代测序方法获得的短序列长度不足以跨越包含长重复的区域。这种长度限制是通过第三代测序平台(如太平洋生物科学技术公司)获得的长读来解决的。尽管如此，读取长度的增加伴随着明显的错误...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wangchuang2017 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。