1、首先,创建一个blast+数据库
makeblastdb -in <my_seqs.fna> -dbtype nucl -out <my_db>
2、接下来,使用来自blast+包的巨型爆破执行序列的全队全部爆破
blastn -query <my_seqs.fna> -db <my_db> -outfmt '6 std qlen slen' -max_target_seqs 10000 -o <my_blast.tsv> -num_threads 32
3、注意:使用-perc_identity标志将以牺牲灵敏度为代价加快搜素速度
blastn -query <my_seqs.fna> -db <my_db> -outfmt '6 std qlen slen' -max_target_seqs 10000 -perc_identity 90 -o <my_blast.tsv> -num_threads 32
4、接下来,通过组合序列对之间的局部比对来计算成对的ANI
anicalc.py -i <my_blast.tsv> -o <my_ani.tsv>
5、最后,使用MIUVIG推荐参数(95%ANI + 85%自动对焦)执行类似UCLUST的聚类分析
aniclust.py --fna <my_seqs.fna> --ani <my_ani.tsv> --out <my_clusters.tsv> --min_ani 95 --min_tcov 85 --min_qcov 0
详细点这