扩增子的测序数据的拼接软件有很多,这里简单举下flash 操作例子(执行快)
原理:基于序列overlap关系进行拼接(可参考:http://www.360doc.com/content/18/0222/19/19913717_731533203.shtml)
flash -q -c -M 100 -x 0.2 split.reads_01.fastq split.reads_02.fastq> merge.reads.fastq
-q : --quiet
-c : --to-stdout
-M : --max-overlap
-x : --max-mismatch-density (Default: 0.25)
## 注意的是-M 根据测序策略和16 突变区的大小决定 V4 长度约为290bp。(选择80~100)
软件的文献阅读、下载
参考文献:PMID:21903629
https://sourceforge.net/projects/flashpage/files/