Canu
Canu是基于OLC算法,具有长reads的自纠错和组装功能,是应用最为广泛的三代组装软件(速度相对较慢)。
Canu相关使用方法来啦!!!
一、Canu的安装
方法一:conda安装
conda install -c bioconda canu
方法二:GitHub上去下载逐步安装
https://github.com/marbl/canu/releases
二、运行流程
Canu分三个阶段进行组装运作:
· 修正 (Corret)
· 修剪 (Trim)
· 组装 (Assemble)
修正阶段将会提高reads中碱基的准确性。修剪阶段将reads修剪到,看起来像高质量序列,并删除可疑的区域,例如剩余的SMRTbell的adpaters。组装阶段将reads排序为contigs,生成对应的共有序列(consensus suquences) 并创建可能的共有序列互相相连的路径。
三、Canu参数说明
Canu对pacbio和nanopore原始数据的组装分为三个步骤:纠错,修整和组装。每一步经历以下几个步骤:
1.加载read到read数据库(seqStore)
2.进行k-mer计数
3.计算overlap,加载到数据库(OvlStore)
4.根据overlap进行纠错/修剪/组装