目前在文献存在多种利用不同的数据类型进行系统发育树的构建。
一. 数据类型
(1)SNP-单核苷酸多态性(Single nucleotide polymorphism)
(2)转录组数据
(3)单拷贝直系同源基因(single-copy orthologous genes) 利用orthofinder寻找单拷贝基因构建系统发育树
(4)低拷贝基因(LCN, low copy nucleotide)参考文献 The water lily genome and the early evolution of flowering plants
(5)位于单拷贝同源基因的区域的SNP(SNPs located in the regions of single-copy orthologous genes)
(6)基于核基因组、叶绿体(chloroplast -cp)和线粒体(mitochondrion -mt)
二. 构树方法
主要有距离法(UPGMA),最大似然法(ML),邻接树法(NJ)等
具体参照 构树方法
三. 构树软件
- MEGA(分子进化遗传学分析): MEGA 是一个综合软件包,提供系统发育分析工具,包括序列比对、模型选择、树构建(最大似然、邻接和 UPGMA)和树可视化。 它还提供了用于进化分析的各种统计测试和工具。
- 物理层: PhyML 是一种流行的基于最大似然的系统发育树构建工具。 它实现了高效的算法,并提供了选择进化模型、执行分支支持分析和可视化树的选项。 PhyML 以其处理大型数据集的速度和准确性而闻名。
- RAxML(随机轴化最大似然法): RAxML 是一种广泛使用的软件,用于基于最大似然的系统发育推断。 它支持各种替代模型、用于分支支持估计的自举以及用于大规模分析的并行计算。 RAxML 对于使用 DNA 或蛋白质序列数据构建系统发育树特别有用。
- BEAST(通过采样树进行贝叶斯进化分析): BEAST 是一个强大的系统发育树贝叶斯推理和分子钟分析软件包。 它允许估计分歧时间、进化速率和祖先特征状态。 BEAST 提供了一个灵活的框架来整合复杂的进化模型和先验信息。
- PAUP*(使用简约的系统发育分析): PAUP* 是一种广泛使用的基于简约方法的系统发育分析软件。 它提供用于序列比对、树重建、自举分析和字符状态优化的工具。 PAUP* 支持各种启发式搜索算法并提供用户友好的界面。
- 贝叶斯先生: MrBayes 是一款流行的贝叶斯系统发育推理软件。 它使用马尔可夫链蒙特卡罗 (MCMC) 方法来探索树空间并估计后验概率。 MrBayes 支持不同的替代模型、分区模型和复杂的进化模型。 它还提供用于可视化和收敛诊断的工具。
- ClustalW 和 Clustal Omega: ClustalW 和 Clustal Omega 是广泛使用的多序列比对工具。 他们根据相似性比对 DNA 或蛋白质序列,并生成适合系统发育分析的比对。 Clustal Omega 是一个改进版本,可以更高效地处理大型数据集。
- 无花果树: FigTree 是一种用户友好的工具,用于可视化和注释系统发育树。 它支持不同的树文件格式,并提供用于自定义树外观的选项,例如颜色编码、分支长度缩放和标签格式。
四. 可视化和美化软件
常见的软件:
1. iTOL
2.Evolview
3.Figtree