使用nextpolish对三代组装进行polish
NextPolish是武汉未来组开发的一个三代基因组polish工具(另外一个常用软件是Pilon)。NextPolish可以使用二代短读序列或者三代序列或者两者结合去纠正三代长读长序列在组装时导致的碱基错误(SNV/Indel)。由于它是专为polish设计,因此在运行速度和内存使用上都优与Pilon。
软件安装
先确保自己的服务器上安装了Python2.7, 且有Shutil和Signal,或者你可以利用conda新建一个python2.7的环境。
# shell
python -V
Python 2.7.15
# Python 交互命令行
import shutil
import signal
mkdir -p ~/opt/biosoft
cd ~/opt/biosoft
wget https://github.com/Nextomics/NextPolish/releases/download/v1.0.5/NextPolish.tgz
tar -zxvf NextPolish.tgz
# 编译软件
cd NextPolish && make -j 10
# 加入到.bashrc或.zshrc
export PATH=~/opt/biosoft/NextPolish:$PATH
软件使用
注意:如果你的基因组用的是miniasm这类缺少consensus步骤的组装软件,那么你需要先用运行如下命令,或者是运行racon利用三代序列进行polish。否则,由于基因组上存在过高的错误率,导致二代序列错误比对,影响polish效果。
thread