常用工具
1. PSi-blast
Psi-balst是一种更加高灵敏的Blastp程序,对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效.多用于生成蛋白质的多序列比对(MSA)和PSSM(特异性位置打分矩阵)。相关指令和生成PSSM文件的代码参考:
2.Clustal
Clustal可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。Clustal包括Clustalx和Clustalw(前者是图形化界面版本后者是命令界面),是生物信息学常用的多序列比对工具。
3. CD-HIT
CD-HIT是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类以去除冗余的序列,一般用于构建非冗余的数据集用于后续的实验分析。官网链接(http://weizhongli-lab.org/cd-hit/)
4. MMSeq2
MMseqs2(多对多序列搜索)是一个软件套件(