生物信息学跟计算机一样,更新换代都是比较快的,还不能说当年我们用的经典软件,可能在现代来说已经过时了,因而与时俱进对于生物信息人员来说是很重要的。
当我们尝试使用EBI上的在线工具ClustalW2进行比对时,我们发现他已经光荣的退役了。
网站推荐做蛋白序列的多序列比对建议使用Clustal Omega
(https://www.ebi.ac.uk/Tools/msa/clustalo/)
做核酸序列多序列比对采用MUSCLE
(https://www.ebi.ac.uk/Tools/msa/muscle/)
本文主要讲述ClustaW2的替代工具之一MUSCLE用法。
在线版本如上,非常简单,小编在此不做介绍。下面主要说一下Linux版本用法,方便对于大批量序列的快速比对。
下面是MUSCLE的主要参数:
可以看到两个主要的参数-in 和-out,分别是输入和输出。
基础命令:
muscle -in seq.fa -out seq.aligned.fa
muscle -in seq.fa -phyiout seq.aligned.phy(常用的构建ML进化树所采用的MUSCLE命令)
MUSCLE的所有输出格式见下面,只需要仿照上面的命令改成相应的输出参数即可。
-clwout filename CLUSTALW format. By default, will write MUSCLE as the program name in the file header. If the -clwstrict option is specified, then the program name will be written as "CLUSTAL W (1.81)". Th