【计算分子进化】核苷酸替换HKY85模型、F84和TN93模型

本文概述了计算分子进化中的JC69、K80、TN93、HKY85和F84模型,介绍了它们的转移速率矩阵、概率转移矩阵以及如何计算序列进化距离。重点讲解了TN93模型的非对称性以及如何通过特征值分解求解。
摘要由CSDN通过智能技术生成

(本博客是博主在课题组小组内讨论分享内容,依据杨子恒老师《计算分子进化》英文版/复旦中译版内容进行总结和提炼)​​​​​​​

1.回顾JC69和K80

首先回顾一下之前讲到的JC69和K80模型,这两个模型都是在连续时间马尔可夫过程(CTMC)这随机过程模型框架下提出的。每个模型的框架都如下:

1.给出模型的转移速率/置换率矩阵Q的形式,Q矩阵代表当时间趋近于零时的瞬时转移概率,Q矩阵也可称为马氏半群的最小生成元

2.概率转移矩阵P,计算得到具体表达式

3.分析各矩阵的性质,如极限分布,参数的生物学含义等

4.基于该模型计算序列进化距离等参数,并推导参数的方差

JC69和K80模型的置换率矩阵的形式都是对称的 ,这样的马尔可夫链的平衡形式,各个状态的概率相等,具体来讲,在核苷酸替换模型中,每个核苷酸的平衡概率都是1/4

需要注意的是,本节中介绍的几个替换模型都不满足这个条件。

2.TN93模型

TN93模型是本节三个模型中,最一般化的情况,在推导完成后,很容易推广/特殊情况到其他模型,因此先介绍。

置换率矩阵Q:

用特征值分解的方法解P矩阵

极限分布是当t趋近于无穷大的时候,由上式可知,其极限分布如下

接下来则是求序列距离,在估计序列距离时,采用的方法的核心思想如下:

 推导出期望值的距离表达式函数,然后将从实际序列中获得的观测值代替期望值

其推导范式如下:

 1.根据速率矩阵推导核苷酸置换率lambda,由速率矩阵参数和时间t表示距离d

 2.推导期望概率,带入观测频率

 3.解方程组

给出一个具体的推导过程,实际的式子详见教材,我在这里给出每一步,实际上是在做什么事

 ​​​​​​​

 方差仍然是用delta技术来算,具体见教材附录

3.HKY85模型

首先看转移速率矩阵Q

跟TN93相比,就是不去区分两种转换(嘌呤之间、嘧啶之间),因此,只要取

4.F84模型

同样先看Q矩阵

这个模型相当于在TN93中

相比之下减少了一个参数,求解过程同样也是特征值分解的方法,感兴趣可以自己推下,推荐一下符号化计算神奇工具wolframalpha.com

5.其他注意事项

对于更简单的模型,可能有比特征值分解更简单的方法,例如解微分方程等。

在中文版的教材中,存在一些翻译导致的歧义,特此订正一下:

1. 中文版:

英文版:

 

这里说的是对TN93不能使用JC69和K80那样的对称策略,因为TN93的Q不是对称的,翻译全责。。() 

 

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值