使用 PhyML 构建进化树

使用 PhyML 构建进化树

使用 PhyML 构建进化树

  1. PhyML 简介
    使用 PhyML 构建最大似然树。
    参考文献:New Algorithms and Methods to Estimate Maximum-Likelihood Phylogenies: Assessing the Performance of PhyML 3.0

  2. PhyML 的下载和安装
    $ wget http://www.atgc-montpellier.fr/download/binaries/phyml/PhyML-3.1.zip
    $ unzip PhyML-3.1.zip
    $ mv PhyML-3.1 /opt/biosoft/
    $ ln -s /opt/biosoft/PhyML-3.1/PhyML-3.1_linux64 /opt/biosoft/PhyML-3.1/PhyML
    $ echo ‘PATH=$PATH:/opt/biosoft/PhyML-3.1/’ >> ~/.
    $ source ~/.bashrc

  3. PhyML 的使用
    PhyML 的输入文件为 phylip 格式。

常用例子:

$ PhyML -i proteins.phy -d aa -b 1000 -m LG -f m -v e -a e -o tlr
常用参数:

-i seq_file_name
输入文件,phylip 格式的多序列比对结果。
-d data_type default:nt
该参数的值为 nt, aa 或 generic。
-b int
设置 bootstrap 次数。
-m model
设置替代模型。 核酸的模型有: HKY85(默认的), JC69, K80, F81, TN93, GTR ; 氨基酸的模型有:LG (默认的), WAG, JTT, MtREV, Dayhoff, DCMut, RtREV, CpREV, VT, Blosum62, MtMam, HIVw, HIVb 。
-f e,m or fA,fC,fG,fT
设置频率计算的方法。 e 表示使用比对结果中不同氨基酸或碱基出现的频率来计算; m 表示使用最大似然法计算碱基频率,或使用替换模型计算氨基酸频率; fA,fC,fG,fT 则是 4 个浮点数,表示 4 中碱基的频率,仅适合核酸序列。
-v prop_invar
设置不变位点的比例,是一个[0,1]区间的值。或者使用 e 表示程序获得其最大似然估计值。
-a gamma
gamma 分布的参数。此参数值是个正数,或者使用 e 表示程序获得其最大似然估计值。在 ProtTest 软件给出的最优模型中含有 G 时,使用该参数。
-o params
参数优化的选项。t 表示对 tree topology 进行优化; l 表示对 branch length 进行优化; r 表示对 rate parameters 优化。
params=tlr 这表示对 3 者都进行优化。 params=n 表示不进行优化。
4. PhyML 结果
PhyML 的输出结果为:

proteins.phy_phyml_tree.txt : 最大似然法构建的进化树
proteins.phy_phyml_boot_stats.txt : bootstrap 的统计信息
proteins.phy_phyml_boot_trees.txt : bootstrap 树
proteins.phy_phyml_stats.txt : 程序运行的中的参数和结果统计# 欢迎使用Markdown编辑器

原文来自:

http://www.chenlianfu.com/?p=2221

https://www.plob.org/article/9891.html

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值