Chapman-Kolmogorov 定理

Chapman-Kolmogorov 定理是关于马尔可夫链转移概率的定理,它描述了链在不同时间步之间的转移概率如何组合。

假设有一个离散时间的马尔可夫链,其状态空间为 S S S,转移概率矩阵为 P P P,表示在一步时间后从状态 i i i 转移到状态 j j j 的概率为 P i j P_{ij} Pij。Chapman-Kolmogorov 定理说明了在任意 n n n步时间后,链从状态 i i i 转移到状态 j j j 的概率,用 P i j ( n ) P^{(n)}_{ij} Pij(n)表示:

P i j ( n ) = ∑ k ∈ S P i k ( n − 1 ) ⋅ P k j P^{(n)}_{ij} = \sum_{k \in S} P_{ik}^{(n-1)} \cdot P_{kj} Pij(n)=kSPik(n1)Pkj

这个定理的核心是:从状态 i i i 经过 n n n 步到达状态 j j j的概率,等于在 n − 1 n-1 n1步内从状态 i i i 到达其他所有可能的状态 k k k 的概率 P i k ( n − 1 ) P_{ik}^{(n-1)} Pik(n1),然后再从状态 k k k转移到状态 j j j的概率 P k j P_{kj} Pkj的总和。

这个定理非常重要,因为它允许我们计算马尔可夫链在任意时间步之后状态转移的概率。通过递归地应用转移概率矩阵 P P P,可以计算链在未来时间步的状态分布情况,以及链在长时间内的行为特性,比如收敛到平稳分布的情况。

当涉及马尔可夫链和 Chapman-Kolmogorov 定理时,我们可以考虑一个简单的例子。

假设我们有一个具有三个状态的马尔可夫链,状态空间为 { 晴天 ( S u n n y ) , 阴天 ( C l o u d y ) , 雨天 ( R a i n y ) } \{晴天 (Sunny), 阴天 (Cloudy), 雨天 (Rainy)\} {晴天(Sunny),阴天(Cloudy),雨天(Rainy)}。假设该链的转移概率如下:
P = [ 0.6 0.3 0.1 0.2 0.6 0.2 0.3 0.4 0.3 ] P = \begin{bmatrix} 0.6 & 0.3 & 0.1 \\ 0.2 & 0.6 & 0.2 \\ 0.3 & 0.4 & 0.3 \\ \end{bmatrix} P= 0.60.20.30.30.60.40.10.20.3
现在我们想计算这个链在 2 步时间后从状态 S 转移到状态 R 的概率 P S R ( 2 ) P^{(2)}_{SR} PSR(2)

根据 Chapman-Kolmogorov 定理:

P S R ( 2 ) = ∑ k ∈ S P S k ( 1 ) ⋅ P k R P^{(2)}_{SR} = \sum_{k \in S} P^{(1)}_{Sk} \cdot P_{kR} PSR(2)=kSPSk(1)PkR

其中 P S k ( 1 ) P^{(1)}_{Sk} PSk(1)表示在一步时间后从状态 S S S 转移到状态 k k k 的概率。

P S R ( 2 ) = ∑ k ∈ S P S k ( 1 ) ⋅ P k R = P S S ( 1 ) ⋅ P S R + P S C ( 1 ) ⋅ P C R + P S R ( 1 ) ⋅ P R R = 0.6 × 0.1 + 0.3 × 0.2 + 0.1 × 0.3 = 0.15 P^{(2)}_{SR} = \sum_{k \in S} P^{(1)}_{Sk} \cdot P_{kR}=P^{(1)}_{SS} \cdot P_{SR}+P^{(1)}_{SC} \cdot P_{CR}+P^{(1)}_{SR} \cdot P_{RR}\\=0.6×0.1+0.3×0.2+0.1×0.3=0.15 PSR(2)=kSPSk(1)PkR=PSS(1)PSR+PSC(1)PCR+PSR(1)PRR=0.6×0.1+0.3×0.2+0.1×0.3=0.15

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值