使用Canu对三代测序进行基因组组装

最新推荐文章于 2024-04-15 09:38:02 发布

weixin_34167819

最新推荐文章于 2024-04-15 09:38:02 发布

阅读量2.7k

点赞数

文章标签：数据库 shell

原文链接：https://yq.aliyun.com/articles/650511

版权

Canu简介

Canu是Celera的继任者，能用于组装PacBio和Nanopore两家公司得到的测序结果。

Canu分为三个步骤，纠错，修整和组装，每一步都差不多是如下几个步骤：

加载read到read数据库，gkpStore
对k-mer进行技术，用于计算序列间的overlap
计算overlap
加载overlap到overlap数据库，OvlStore
根据read和overlap完成特定分析目标
- read纠错时会从overlap中挑选一致性序列替换原始的噪声read
- read修整时会使用overlap确定read哪些区域是高质量区域，哪些区域质量较低需要修整。最后保留单个最高质量的序列块
- 序列组装时根据一致的overlap对序列进行编排(layout), 最后得到contig。

这三步可以分开运行，既可以用Canu纠错后结果作为其他组装软件的输入，也可以将其他软件的纠错结果作为Canu的输入，因此下面分别运行这三步,并介绍重要的参数。

几个全局参数：genomeSize设置预估的基因组大小，这用于让Canu估计测序深度； maxThreads设置运行的最大线程数；rawErrorRate用来设置两个未纠错read之间最大期望差异碱基数；correctedErrorRate则是设置纠错后read之间最大期望差异碱基数，这个参数需要在组装时多次调整；minReadLength表示只使用大于阈值的序列，minOverlap

最低0.47元/天解锁文章

weixin_34167819

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
使用Canu对三代测序进行基因组组装

Canu简介Canu是Celera的继任者，能用于组装PacBio和Nanopore两家公司得到的测序结果。Canu分为三个步骤，纠错，修整和组装，每一步都差不多是如下几个步骤：加载read到read数据库，gkpStore对k-mer进行技术，用于计算序列间的overlap计算overlap加...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。