一般来说,文献中使用的“转换/颠换”比率有三种定义,需要进行明确的区分,以免产生误解。
1.转换/颠换数目比
即
这种方法不矫正多重击中,多重击中的示意图如下,直观可理解为我们不知道从祖先序列到现在的序列,中间经历了什么,而连续时间马尔可夫过程的ck方程解决的就是这个问题,我们可以认为连续时间马尔可夫过程考虑了所有可能的中间状态。
该方法不是推荐方法,因为它仅对很相似(分歧度)低的序列有效,当序列分歧度很大时,无论模型的kappa值为多少,该值都趋近于1/2。
2.kappa值
这种方法是基于K80和H85模型中的kappa参数,估算模型中kappa参数的值
3.期望转换/颠换比率
两条序列间转换和颠换期望数目的比率,与第一种方法相比的主要区别是,这种方法基于马尔可夫链计算,校正多重击中问题
文中举例给出了最一般的情况
从一个状态到另一个状态的流(flow):该状态的比率✖️从该状态变为另一状态的速率
在本式中, 分子代表平均转换数,分母代表平均颠换数
每个模型的R值如下所示,具体计算方法,就是把平衡状态及转移速率矩阵代入上式计算即可。
4.关于不同模型中的kappa值计算
在F84和HKY85中的kappa参数的含义是不一样的,要加以区分
粗略关系的推导过程如下:
基于R相等的假设,也可以进行更加准确的参数估计,具体步骤如下:
kappa更常用于检验转换与颠换没有差异的零假设,而R则更便于比较不同模型下的估计,二者面向的需求和应用场景是不同的。