参考文章http://www.biotrainee.com/thread-1465-1-1.html http://blog.sina.com.cn/s/blog_83f77c940102vny3.html
1. 下载、安装
下载地址:https://github.com/bbuchfink/diamond
$ tar xzf diamond-linux64.tar.gz
2. 使用
建立索引
$ diamond makedb --in nr.faa -d nr
比对:
$ diamond blastx -d nr -q reads.fasta -o matches.m8 --sensitive -b 16.0 -e1e-5
-q:可以是fasta或fastq(可以是压缩的)
--taxonmap :后接文件,蛋白质accession 号对应的物种id,下载地址:ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz
--sensitive:比对长片段
--more-sensitive:比对长片段
--outfmt/-f:0 BLAST pairwise format 5 BLAST XML format
6 BLAST tabular format (默认) ,可以自己设置,与blast+相似,如:--outfmt '6 qseqid qlen sseqid slen pident length mismatch gapopen qstart qend sstart send evalue bitscore staxids'
默认: qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore
100 DIAMOND alignment archive (DAA)
101 SAM format
--max-target-seqs/-k:最大比对输出数,默认25,(1,则输出最好的那个)
--evalue/-e:默认0.001
--block-size/-b :使用内存,默认值2.0则为12G,
--threads/-p:CPU线程数,默认使用所有的