系统发育树(phylogenetic tree)构建的软件可谓五花八门。大体上,有如下几种策略:从最简单的UPGMA法,到邻接法(neighbor joining),最大简约法(most parsimonious),再到最大似然法,以及贝叶斯法,每种方法都有不少可以选择的工具。
最大似然法和贝叶斯法,在现在,被认为是两种比较可靠的建树策略。贝叶斯法的最大劣势在于速度太慢,其达到convergence的漫漫长路让无数研究者望而却步。所以,一些研究者为了快速出树会采用快速的邻接法或最大简约法建树。其实,这些方法(邻接法、最大简约法)并不严谨,特别是在处理有较大分歧的序列时,long branch attraction(LBA,长枝勾引)现象可能导致严重的错误。
因此,最大似然法是很多杂志上青睐的建树策略。MEGA、phyml同raxml是比较常用的提供最大似然法建树的软件。然而,要注意的是,虽然速度上相对贝叶斯法有优势,但在今天实验室里,纵使快如raxml亦或是新如MEGA X,也越来越无法满足研究人员只争朝夕的节奏和日益高涨的雄心。此外,对于特别专业的研究者,有时需要选择进化模型(核苷酸或氨基酸替代模型)——如果不幸运的话,不合适的模型选择会直接影响到树的结构,导致错误的结论。而模型选择往往需要借助其他工具进行,这使得大家在软件的使用上有些不方便。再者,比如RAxML,其对于核苷酸替换模型的支持很差,只有屈指可数的几个模型可供选择。
本文为大家推介一款近年来悄然兴起的最大似然法进化树构建软件——IQTREE。自2014年11月问世以来,截止2018年6月13日,IQTREE已收获了778次引用(谷歌学术,下同),而RAXML是6180。相对于raxml,其总引用数虽然相距甚远,但最近势头却更加强猛:IQTREE在2017年321 citations,2018年上半年未结束就已经达到277 citations;而RAxML在2017年2200 citations,进入2018赛季目前是1290 citations。
IQ-TREE主要由来自奥地利维也纳大学(Universität Wien)的越南天才学者BùiQuang Minh(裴广明,似乎是这么译的)开发。提供包括windows(64/32位)、linux(64/32位)、以及macs在内的多平台不同版本。
如下图所示,IQ-TREE有四大功能,在很大程度上解决了前面提到的最大似然法建树软件、尤其是速度上的几个缺陷:
高效建树(efficient tree reconstruction)
模型选择(modelfinder: fast and accurate model selection)
超快自展(ultrafast bootstrap approximation)
大型数据(big data analysis)