马尔可夫链相关学习(一)

本文介绍了马尔可夫链的基础知识,包括马尔可夫链的定义、转移概率矩阵(TPM)以及不可约马尔可夫链中状态的分类。通过学习,你可以理解状态之间的转移概率以及马尔可夫链在随机过程中的应用。
摘要由CSDN通过智能技术生成

马尔可夫链基础知识学习

最近在学习马尔可夫链的相关知识,希望这些总结可以帮助到需要的小伙伴。
感兴趣的读者可以参考Ross和Haggstrom的教材

一些基本概念

马尔可夫链的定义

马尔可夫链表示的是一个随机变量序列,系统在某个时刻的状态只依赖于其前一时刻的状态,与再之前的状态都是无关的。

考虑随机过程:{ X(n),n=0,1,2,···· } 。其取值是一个有限或者可数的集合M(称为状态空间),我们一般假设状态空间M为 { 0, 1, 2, ···· } ,其中的元素称为状态。

则我们可以定义Pij = P(X(n+1)= i | X(n)= j,X(n-1)= in-1, ··· , X(0)= i0) n ≥ 0 n\geq0 n0。其中 i, j, i0, i1, ··· , in-1* ∈ \in M。则pij 就表示状态 j 转移到状态 i 的概率,称此随机过程为马尔可夫链

转移概率矩阵TPM

我们定义TPM如下:P = [ pij ] , 其中pij如上面的定义,这个矩阵称为一步转移概率矩阵。
相对应的我们就可以定义
n
步转移概率矩阵,定义pij (n)表示状态 j 经过n步之后转移到状态 i 的概率。
命题:P(n) = Pn
这里的P(n)n步转移概率矩阵,P为一步转移概率矩阵,我们可以使用数学归纳法来证明这个命题。
pij(n+1) = ∑ k ∈ M \sum_{k\in M} kM pki(n)pjk(1) = ∑ k ∈ M \sum_{k\in M} kMpkinpjk = [ pn+1 ]ij
而且有如下结论:P(m)P(n) = PmPn = Pm+n = P(m+n)

若假设时刻 n n n=0时,

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值