今天用BLASTX将我的转录本序列在UniProt蛋白数据库(700w条序列)中搜索,80个线程,过了1小时大概就分析1000条吧。实在是有点慢,于是我想到之前耳闻的DIAMOND,据说速度非常快,于是我测试了下。没想到,这工具居然那么快。
根据DIAMOND介绍,它有以下特点
比BLAST快500到20,000倍
长序列的移框联配分析(frameshift alignment)
资源消耗小,普通台式机和笔记本都能运行
输出格式多样
我就看中它一点,速度快。
软件安装异常的简单,因为提供了预编译的64位可执行文件
wget http://github.com/bbuchfink/diamond/releases/download/v0.9.25/diamond-linux64.tar.gz
tar xzf diamond-linux64.tar.gz
# 有root全新啊
</