构建进化树可以用DNA序列,也可以用protein序列。本文就如何利用蛋白序列进行进化树的构建步骤进行详细解析:
一、利用phylip进行蛋白序列进化树分析步骤
1. 运行Clustalw,得到protein.phy文件;
2. 运行seqboot,输入protein.phy文件,输出protein_1.outfile。R选择1000,seed number: 3,然后选择Y。将得到的protein_1.outfile改名为protein_2.infile。
3. 运行protpars,输入protein_2.infile,输出protein_2.outfile和protein_2.outtree。J选择3(seed number),5(jumple number),M值选择D,然后输入1000 (sets)。最后选择Y。将得到的protein_2.outtree改为.
4. 运行consense,输入protein_3.intree,选择Y。得到protein_3.outfile和protein_3.outtree
到此为止,利用seqboot计算的bootstrap值已经完成,但是protein_3.outtree构建的tree没有branch length数据,无法直观的显示序列之间的差异。此时,应该利用tree-puzzle来计算branch length。http://java.com/en/download/index.jsp )
Tree-puzzle使用说明
利用tree-puzzle计算branch length步骤:
1. Windows下,进入tree-