简介
Velvet是处理从头测序(de novo)基因组组装及短读长序列比对的一个算法包。 这是使用德布鲁因图通过消调试误和化简重复区域而来进行基因组序列组装。
Geneious、MacVector、BioNumerics等商业软件包的内部也实现了Velvet。
目前用于新一代的测序的主要仪器有:
- Illumina/Solexa的Genome Analyzer
- ABI的Solid
- Roche的454
它们都能高通量的测序,产生大量的测序结果,接下来就要对序列进行拼接,用于拼接的软件也有很多,比如velvet、soap、abyss、maq等,454的还有专门的newbler。
velvet对短序列的拼接效果比较好,所以多用于对Illumina等产生的短序列片段进行组装拼接。
背景
第二代定序仪 (NGS)的开发增加了很短读长测序的成本效率。使用德布鲁因图来比对的方法匹配实际需求,但进一步的开发需要解决错误和重复的问题。这促使欧洲生物信息研究所的Daniel Zerbino和尤安·伯尼在英国开发了Velvet。
Velvet可以通过化简和压缩来快速操纵德布鲁因图,而不丢失图的信息,把不相交的路径聚成单个节点。它通过首先使用合并序列的错误校正算法消除了错误消调试误,并解决重读。
将read和read pair组合让Velvet解决小的重复并产生合理长度的重叠序列。
Velvet的应用对双端(测序的)原核生物数据和哺乳动物区域可以产生N50长度 50 kb 的重叠序列。