nanopore组装软件wtdbg2原理及使用
wtdbg2优点是速度非常快,安装使用都非常简单。
原理
首先要注意,wtdbg2不同于megahit等二代组装软件DBG的原理,wtdbg2得到的图称为fuzzy-Bruijn graph (FBG), 作者在文中提到:
A ‘base’ in FBG is a 256 bp bin(each small box ) and a ‘K-mer’ or K-bin in FBG consists of K consecutive bins on reads.
也就是说:DBG中的 a base在wtdbg2中是一个256bp的bin, DBG中的K-mer在wtdbg2中是指reads上连续的至少四个bin。
wtdbg2原理步骤:
-
把所有的reads都加载进内存,数Kmer的个数。
-
把reads分成以256bp为一个单元的bin(图中每个box),一个Kmer至少有4x256bp。也就是说reads分布都低于4x256 bp的nanopore或者pacbio数据咱们只能换个软件了!!
-
different K-bins may be represented by a single vertex if they are aligned together based on all-versus-all read alignment. (不知道怎么翻译会更准确