Muscle

一、功能分类: 多序列比对

二、软件官网:http://www.drive5.com/muscle/

Muscle进行多序列比对193

三、软件介绍:
MUSCLE(Multiple Protein Sequence Alignment)。它是一款非常简单好用的软件,muscle也是肌肉的意思,也寓意此款软件功能强劲有力。
muscle是在2004年公布的一款蛋白质水平多序列比对的开源软件,在速度和精度上都优于ClustalW。比对速度快。因此在进行多序列比对的时候,大多数情况下可以优先使用Muscle。例如Mega等软件里面也集成了muscle的多序列比对。
Muscle同样可以用于DNA的多序列的比对。使用起来十分方便,大多数情况下用户只需要指定输入输出文件即可。它是适合于多序列比对,多个序列之间具有同源关系,并且具有同一方向,muscle需要对序列进行拉伸,例如适合同一个或多个看家基因、16s等放在一起比对。我们同样也可以将多样品的SNP结果连接起来进行多序列比对,做系统发育分析。所以对于我们使用muscle主要需要做的就是将输入文件格式化为满足muscle输入即可,主要就是fasta格式。

四、下载安装

wget http://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gz

tar -zxvf muscle3.8.31_i86linux64.tar.gz
mv muscle3.8.31_i86linux64 muscle

chmod +x muscle

五、软件使用:

选项参数:

-in 输入文件,必须为fasta 格式的序列文件
-out 输出文件,默认输出为mfa格式
-diags 适用于输入序列同源性比较高的序列
-maxiters 最大迭代次数,默认为16
-maxhours 最长迭代时间,默认无限制
-clw 输出CLUSTALW 格式的结果
-clwstrict 同-clw,输出文件的头部包含 “CLUSTAL W (1.81)” 字样
-html 输出HTML 格式结果
-msf 输出msf 格式结果
-log[a] 日志文件,-loga 表示添加,-log 则直接覆盖已有日志文件
-quiet 不要向标准错误流打印进度信息
-stable 按着输入文件中
-group 按着序列的相似度
-version 版本信息
六、使用案例:
现有一个包含多序列的fasta格式文件multi.fasta

muscle -in multi.fasta -out ex1.mfa
muscle -in multi.fasta -out ex1.clw -clw

muscle -in sequence.fasta -out sequence.mfa
 muscle -in sequence.fasta -out sequence.clw -clw


七、注意事项:

 

1、Muscle是多序列比对软件,它与Blast和Mummer是完全不同的,这些工具适合全基因组比对
2、序列的方向要一致;

介绍一款可以自动识别基因类型的序列比对软件 Muscle

熊荣川 xiongrongchuan@126.com

通常我们对比的基因序列有两大类型:编码基因序列以及非编码基因序列。也正因为这样我 们基因比对的策略是不一样的:

前者比对的基本单位是密码子,序列长度以及空格的长度都 必须是 3 的倍数,这样才有生物学意义同时也是对基因序列进行后续分析的必须要求;后者 由于是非编码基因,所以比对的基本单位就是核苷酸。

我们常用的序列比对软件 clustalW 通常用来比对非编基因,我们之前也介绍过 Mega5 相较 于 Mega4 的新功能之一就是可以进行基于密码子的基因序列比对。 下面我们介绍一款可以自动识别不同类型基因序列,并自动按照相应规则进行比对的软件 Muscle.exe

首先我们使用一个非编码基因(16S rDNA)进行模拟演示 序列文件 16S34.fas 和 Muscle.exe 放在同一个文件夹中。然后,在该文件夹中用记事本创建 一个 bat 格式文件 bear.bat,这个文件相当 PAML 中 control 文件(以后我们会专题介绍)。

输入 muscle -in 16S34.fas -out seqs.afa 后保存

其中-in 16S34.fas 表示我们的输入序列文件为 16S34.fas -out seqs.afa 表示将产生一个比对后的序列文件 seqs.afa

这时候文件夹中有了 3 个文件

双击 bear.bat 文件开始比对

很快就能比对完成,并生成文件 seqs.afa,可以将后缀名改为 fasta 格式查看,即 seqs.fasta.

接下来我们来对比一个功能基因序列 方法同上,

对比结果如下

很快就能比对完成,并生成文件 seqs.afa,可以将后缀名改为 fasta 格式查看,即 seqs.fasta. 接下来我们来对比一个功能基因序列 方法同上,对比结果如下

MUSCLE
MUSCLE 是一款可以用于快速多序列比对的软件,相比 ClustalW 而言在不损失精度的情况下速度提升了数倍。


MUSCLE 下载
使用 apt 下载

 sudo apt install muscle



使用 conda 下载

 conda install muscle

MUSCLE 使用

  muscle -in NB-ARC.domain.fasta -out NB-ARC.domain.afa -maxiters 2

   -in 输入文件 
    -out 输出文件名,输出文件默认为 Fasta 格式
    -maxiters 最大迭代次数

在处理大数据时,作者建议设置 最大迭代次数为 2,因为超过 2 次迭代后对模型的提升很小。(For large datasets where long execution times becomes an issue, I recommend trying -maxiters 2. Iterations beyond 2 attempt refinement, which often results in a small improvement, at most.)
比对结果如下图所示

在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值