Diamond简明安装与使用教程
对全基因组的基因进行Nr注释是必不可少的一步。由于Nr数据库非常大,导致使用BLAST会消耗巨大的计算资源和时间。使用DIAMOND则能快500-20000倍,而获得和BLAST比较一致的结果。
软件安装
wget https://github.com/bbuchfink/diamond/releases/download/v0.9.24/diamond-linux64.tar.gz
tar xzf diamond-linux64.tar.gz
可以将diamond添加至环境变量,如果不添加的话,每次使用软件时需要加上全局路径。这里可以使用diamond help或diamond version看一下是否安装成功。
下载数据库
从NCBI上下载Nr数据库
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
tar nr.gz
建立数据库索引
使用diamond下面的一个子命令makedb
/home/jilei/anaconda3/bin/diamond makedb --in nr.faa -d nr
输入文件为fasta格式,生成一个.d