Markov 链的基本概念

一个 Markov 链是概率空间上的一个以 \(E\) (至多可数) 为状态空间的随机序列 \(\{X_n: n\ge 0\}\), 它满足 Markov 性和时齐性 (只考虑时齐的情形). 在 Markov 链的情形下, Markov 性与强 Markov 性等价.


记转移概率 \(p^{(n)}_{x,y} = \mathbb P^x(X_n=y)\), 满足 Chapman-Kolmogorov 方程.
若存在 \(n\ge 0\), 使得 \(p^{(n)}_{x,y}>0\), 则称 \(x\) 可达 \(y\); 若互相可达则称互达. 若任意两状态互达, 则称 \(X\) 不可约 (irreducible).

子集 \(C\subset E\) 称为闭的, if 对任意 \(x\in C\), \(y\notin C\), 有 \(p_{x,y} := p^{(1)}_{x,y}=0\). 等价于对任意 \(x\in C\), 有 \(\sum\nolimits_{y\in C}p_{x,y}=1\). 闭集中任何状态不能到达闭集外的状态, 那么 \(X\) 不可约 iff \(E\) 没有非平凡的闭子集.


记首中时 \(\tau_y = \inf\{n\ge1:X_n=y\}\), 约定 \(\inf\varnothing=\infty\). 记 \(f_{x,y} = \mathbb P^x(\tau_y<\infty)\).

状态 \(x\) 是常返的, if 满足下列条件 (这些条件是等价的).

  • \(f_{x,x} = 1\);
  • \(\mathbb P^x(\limsup\{X_n=x\})=1\);
  • \(\sum_n p^{(n)}_{x,y}=\infty\).

否则称为暂留. 在一个互达等价类中, 要么所有状态常返, 要么所有状态暂留.


状态 \(x\) 的周期记为 \(d(x)\), 为 \(\{n\ge1:p^{(n)}_{x,x}>0 \}\) 的最大公因数, 约定空集时 \(d(x)=0\). 若 \(d(x)=1\), 则称 \(x\) 是非周期的 (aperiodic).

\(X\) 是不可约非周期的 Markov 链, 则

  • \(x\), \(y\) 互达, 则 \(d(x)=d(y)\).
  • 对任意 \(x\), \(y\), 存在 \(N\), 对任意 \(n>N\), 有 \(p^{(n)}_{x,y}>0\).

\(\mathbb E^x \tau_x<\infty\), 则称 \(x\) 正常返, 否则称为零常返.
\(x\) 常返, 且 \(\lim_n p^{(n)}_{x,x}\) 存在, 则这个极限等于 \(1/\mathbb E^x \tau_x\).


\(E\) 上一个概率分布 \((\pi_x:x\in E)\) 是转移矩阵 \(P\) 的平稳分布, if \(\pi P=\pi\) (把 \(\pi\) 看作行向量).

一个不可约非周期 Markov 链 \(X\) 有平稳分布 \(\pi\), 则

  • \(X\) 常返;
  • 对任意 \(x\), \(y\), \(\lim_n p^{(n)}_{x,y}=\pi_y\), 平稳分布是唯一的;
  • 对任意 \(x\), \(\pi_x>0\).

例题. 来自 [1] p. 116 第 11 题, 原题可能是来自 Dimitri P. Bertsekas 的那本 Introduction to Probability.

An absent-minded professor has \(r\) umbrellas, used when commuting from home to work and back. If it rains and an umbrella is available, the professor takes it. If no umbrella is available, the professor gets wet. If it does not rain, the professor does not take the umbrella. It rains on a given commute with probability \(p\), independently for all days.

(1) What is the steady-state probability that the professor will get wet on a given day?

(2) Show that for any \(p\), 5 umbrellas can make sure that the professor does not get wet with probability greater than 0.95.

Solution. 用 \(X_n\) 表示他第 \(n\) 次出门时手边的伞的数目, 则这是一个不可约 Markov 链.

\(p_{0,r}=1\).
\(p_{x,r-x} = 1-p\), \(p_{x,r+1-x} = p\), for \(x=1,\dots,r\).

\(\pi_0=(1-p)\pi_r\),
\(\pi_x=(1-p)\pi_{r-x}+p\pi_{r+1-x}\), for \(x=1,\dots,r-1\),
\(\pi_r=\pi_0+p\pi_1\).

可得平稳分布
\(\pi_0 = (1-p)/(1+r-p)\),
\(\pi_x = 1/(1+r-p)\) for \(x = 1,\dots,r\).

故淋湿的极限为 \(p(1-p)/(1+r-p)\).
5 把伞淋湿概率最大约为 0.0455.

References

[1] 应坚刚, 金蒙伟. (2017). 随机过程基础 (第二版) (pp. 98-116). 上海: 复旦大学出版社.

转载于:https://www.cnblogs.com/shiina922/p/10458890.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值