2.1拼接
工具:SPAdes
引用:Bankevich A., Nurk S., Antipov D., GurevichA., Dvorkin M., Kulikov A. S., Lesin V., Nikolenko S., PhamS., Prjibelski A., Pyshkin A., Sirotkin A., Vyahhi N.,Tesler G., Alekseyev M. A., Pevzner P. A. SPAdes: A New Genome AssemblyAlgorithm and Its Applications to Single-Cell Sequencing. Journal ofComputational Biology,2012
2.1.1简介
SPAdes是由俄罗斯科学院圣彼得堡理工大学(St. PetersburgAcademic University of the Russian Academy of Sciences)计算生物学实验室开发的基因组拼接工具。主要用于二代(宏)基因组、(宏)转录组测序的拼接,也可用于一、二、三代测序的混合组装。是目前评价最好的拼接工具之一。
2.1.2安装
wgethttp://cab.spbu.ru/files/release3.11.1/SPAdes-3.11.1-Linux.tar.gz
tar -xzf SPAdes-3.11.1-Linux.tar.gz
cd SPAdes-3.11.1-Linux/bin/
2.1.3使用方法
Python /home/sam/software/SPAdes-3.11.1-Linux/bin/SPAdes.py--meta -k 21,33,55,77,99,127 -1 L1.fq -2 L2.fq -o spa_out/
--meta宏基因组拼接模式
-k k-mer值对于测序深度高的宏基因组数据(50x+)2*150bp的k-mer可设为21,33,55,2*250bp可设为–k 21,33,55,77,99,127
-1双端测序的一端序列
-2双端测序的另一端序列
-o输出文件夹
Ps.服务器(100G RAM 16proc*2.67GHz)上(20G数据量,PE-150策略)拼接时间约12~16小时
2.2拼接评估
工具:QUAST
网址:http://quast.bioinf.spbau.ru/
引用:
2.1.1简介
QUAST用于基因组和宏基因组的拼接评估
2.1.2安装
wget https://downloads.sourceforge.net/project/quast/quast-4.6.0.tar.gz
tar -xzf quast-4.6.0.tar.gz
cd quast-4.6.0
sudo python setup.pyinstall_full
2.1.3使用方法
python/home/sam/software/quast-4.6.0/quast.py contigs.fasta -o res
转载本文请联系原作者获取授权,同时请注明本文来自涂波科学网博客。
收藏
分享
分享到: