今天将给大家介绍一种更为专业的建树方法--用RaxML构建系统发育树。
RAxML详细使用介绍:
构建进化树的方法常见有:
Distance methods (距离法)
- UPGMA (unweighted pair group method with arithmetic means)
- Fitch-Margoliash
- Neighbor-joining
Discrete character methods (独立元素法)
- Parsimony
- Maximum likelihood
首先要用在线的MAFFT进行Alignment
- 复制粘贴所有的fasta序列到文本框中
- UPPERCASE / lowercase: 选择 Same as input
- Direction of nucleotide sequences: Help 选择 Adjust direction according to the first sequence (accurate enough for most cases)
- Output order: 选择 Same as input
- 最后点击Submit
- 我们将邮件中的结果复制粘贴,另存为一个.fasta的文件.
然后用Mesquite 软件打开alignment之后的文件
- 这个软件解压之后可以直接点击运行
- File—open file—选Fasta(DNA)—OK—输出 .nex的文件
- 然后选File—export—Phylip(DNA/RNA)—OK—参数选择序列最长字母数—导出.phylip格式的文件。
在线进行系统发育树构建:
进入ATGC网站
- 上传上一步得到的(PHYLIP format)文件
- 选择建树模型:(如果前期得到了用Jmodeltest的树的模型可以在下列选项中选择一个模型),如果前期没有筛选模型选择GTR; Number of random starting tree: SPR
- Tree Searching: 如果没有给定的树选择:BIONJ,no
- Branch Support: Fast likelihood-based method:no Perform bootstrap:1000, yes
- 然后输入你任务的名字以及接收结果的email地址。
CIPRES 在线建ML树
http://www.phylo.org/portal2/login!input.action 注册登录 点击Creat New Folder
最后进行树的查看与编辑
Figtree (免费软件)查看并编辑树的软件
对于生成的树文件:节点上的数字是Bootstrap value,即自展支持率,或者自展值,是用来检验进化树分支可信度。 自展值,是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。
最后就是用RaxML构建系统发育树
- 程序自带的文件: raxmlHPC、 raxmlHPC-PTHREADS、 run 三个
- 准备文件两个:phy格式的比对好的序列, txt格式的partition文件
raxmlHPC -m GTRGAMMA -p 12345 -s case_6925align.phy -# 1000 –o FJ240310_Fusarium_aethiopicum_NRRL_46738 -n T1
- 另存为一个.fasta的文件:all_SSU_MAFFT_aligned.fasta
CIPRES 在线建ML树
http://www.phylo.org/portal2/login!input.action 注册登录 点击Creat New Folder