https://github.com/EGTortuero/viga
1、介绍
viga -- 从头病毒组注释器
2、参数
1、必须参数
输入文件为核苷酸FASTA文件。他可以包含多个序列
输出名称:没有扩展名的输出文件的名称,因为程序将自动添加它们。默认情况下,程序将使用输入名称作为输出
2、高级参数
轨迹字符串:连续体/序列的名称。如果输入是多FASTA文件,请输入一个通用名称,因为程序将在名称的末尾添加连续体的编号。默认情况下,重叠群的名称将为“LOC”
3、示例
1、执行(仅使用基本参数)的一个示例是:
python VIGA.py --input contigs.fasta --diamonddb databases/refseq_viral_proteins --blastdb databases/refseq_viral_proteins --hmmerdb databases/PVOGS.hmm --rfamdb databases/Rfam.cm --modifiers modifiers.txt
2、另一个示例(这次禁用了 HMMer 的使用,这允许快速执行管道)是:
python VIGA.py --input contigs.fasta --diamonddb databases/refseq_viral_proteins --blastdb databases/refseq_viral_proteins --nohmmer --rfamdb databases/rfam/Rfam.cm --modifiers ../modifiers.txt
3、最后,如果需要在服务器、计算机群集或超级计算机中运行管道,强烈建议使用 --threads 参数:
python VIGA.py --input contigs.fasta --diamonddb databases/refseq_viral_proteins --blastdb databases/refseq_viral_proteins --nohmmer --rfamdb databases/rfam/Rfam.cm --modifiers ../modifiers.txt --threads 10
4、shell脚本
#!/bin/bash
file=$(ls ../cut_vir_contig/)
for f in $file
do
cd ${f%.*}
sudo ~/DATA/Chenhu/viga/run-viga --input $f --diamonddb /data/databases/RefSeq_Viral_DIAMOND/refseq_viral_proteins.dmnd --blastdb /data/databases/RefSeq_Viral_BLAST/refseq_viral_proteins --rfamdb /data/databases/rfam/Rfam.cm --modifiers ../modifiers.txt --gff --nohmmer
echo $f finish
cd ..
done
#!/bin/bash
file=$(ls ../cut_vir_contig/)
for f in $file
do
cd ${f%.*}
sudo ~/DATA/Chenhu/viga/run-viga --input $f --diamonddb /data/databases/RefSeq_Viral_DIAMOND/refseq_viral_proteins.dmnd --blastdb /data/databases/RefSeq_Viral_BLAST/refseq_viral_proteins --rfamdb /data/databases/rfam/Rfam.cm --modifiers modifiers.txt --gff --nohmmer
echo $f finish
cd ..
done