马尔可夫过程1 | 基本概念

6.1 基本概念

马尔科夫链的定义很常见了,在此不再赘述。简单而言就是
P ( X n + 1 = s n + 1 ∣ X 0 = s 0 , . . . , X n = s n ) = P ( X n + 1 = s n + 1 ∣ X n = s n ) P(X_{n+1}=s_{n+1}|X_0=s_0,...,X_{n}=s_n) = P(X_{n+1}=s_{n+1}|X_{n}=s_n) P(Xn+1=sn+1X0=s0,...,Xn=sn)=P(Xn+1=sn+1Xn=sn)
还可以定义一步转移概率、转移概率矩。如果转移概率不随时间变化,就是时间齐次马尔科夫链。

定理 6.1:设随机过程 { X n , n ≥ 0 } \{X_n,n\ge0\} {Xn,n0} 满足

  1. X n = f ( X n − 1 , ξ n ) ( n ≥ 1 ) X_n = f(X_{n-1},\xi_n)(n\ge1) Xn=f(Xn1,ξn)(n1),其中 f : S × S → S f:S\times S\to S f:S×SS
  2. { ξ n , n ≥ 1 } \{\xi_n,n\ge1 \} {ξn,n1} 为独立同分布随机序列,且 X 0 X_0 X0 { ξ n , n ≥ 1 } \{\xi_n,n\ge1\} {ξn,n1} 也相互独立;

{ X n , n ≥ 0 } \{X_n,n\ge0\} {Xn,n0} 是马尔科夫链,并且一步转移概率为 p i j = P ( f ( i , ξ n ) = j ) p_{ij}=P(f(i,\xi_n)=j) pij=P(f(i,ξn)=j).

证明:根据条件 1 可知 ξ n + 1 \xi_{n+1} ξn+1 X 0 , . . . , X n X_0,...,X_n X0,...,Xn 独立,从而有
P ( X n + 1 = s n + 1 ∣ X 0 = s 0 , . . . , X n = s n ) = P ( f ( X n , ξ n + 1 ) = s n + 1 ∣ X 0 = s 0 , . . . , X n = s n ) = P ( f ( s n , ξ n + 1 ) = s n + 1 ) = P ( X n + 1 = s n + 1 ∣ X n = s n ) \begin{aligned} &P(X_{n+1}=s_{n+1} | X_0=s_0,...,X_n=s_n) \\ =& P(f(X_n,\xi_{n+1})=s_{n+1} | X_0=s_0,...,X_n=s_n) \\ =& P(f(s_n,\xi_{n+1})=s_{n+1}) = P(X_{n+1}=s_{n+1} | X_n = s_n) \end{aligned} ==P(Xn+1=sn+1X0=s0,...,Xn=sn)P(f(Xn,ξn+1)=sn+1X0=s0,...,Xn=sn)P(f(sn,ξn+1)=sn+1)=P(Xn+1=sn+1Xn=sn)
证毕。

Note:这个定理实际上是在说 X n X_n Xn 只由 X n − 1 X_{n-1} Xn1 和一个与之完全独立的随机变量 ξ n \xi_n ξn 决定,这与马尔可夫性质异曲同工。并且如果 ξ n , n ≥ 1 \xi_n,n\ge1 ξn,n1 同分布,那么这个马尔可夫过程是时间齐次的,否则是非齐次的。

如果把随机变量看作是信息的话, ξ n \xi_n ξn 就可以看成是从 X n − 1 X_{n-1} Xn1 X n X_n Xn 变化的信息量。

栗子 1:设 { ξ n , n ≥ 0 } \{\xi_n,n\ge0\} {ξn,n0} 独立同分布,取值为非负整数, P ( ξ n = i ) = a i P(\xi_n=i)=a_i P(ξn=i)=ai。令 X 0 = 0 , X n = ∑ k = 1 n ξ k X_0=0,X_n=\sum_{k=1}^n \xi_k X0=0,Xn=k=1nξk,则易证 { X n , n ≥ 0 } \{X_n,n\ge0\} {Xn,n0} 是一个马尔科夫链,因为有 f ( X n , ξ n + 1 ) = X n + ξ n + 1 f(X_n,\xi_{n+1}) = X_n+\xi_{n+1} f(Xn,ξn+1)=Xn+ξn+1。还可以得到转移概率为 p i j = { a j − i , i ≥ i 0 , i < i . p_{ij} = \begin{cases}a_{j-i}, & i\ge i \\ 0, & i < i \end{cases}. pij={aji,0,iii<i.

栗子 2(带吸收壁的随机游动):对称随机游动,每次只能向左或向右移动一个单位,或者原地不动,随机移动限制在 S = { 0 , 1 , . . . , b } S=\{0,1,...,b\} S={0,1,...,b} 内。用 ξ n \xi_n ξn 表示第 n n n 次移动的距离, X n X_n Xn n n n 次移动后的位置,则 X n + 1 = f ( X n , ξ n + 1 ) = X n + ( 1 − δ ( X n − b ) − δ ( X n ) ) ξ n + 1 X_{n+1} = f(X_n,\xi_{n+1}) = X_n + (1-\delta(X_n-b)-\delta(X_n))\xi_{n+1} Xn+1=f(Xn,ξn+1)=Xn+(1δ(Xnb)δ(Xn))ξn+1

栗子 3(G/M/1排队模型):G表示顾客到达服务台的时间间隔,一般假设为独立同分布,分布函数为 G ( x ) G(x) G(x);M表示服务时间,假设为独立同指数分布,且与顾客到达过程独立;1表示单个服务员。

X n X_n Xn 表示第 n n n 个顾客到达服务台时系统内的顾客数, T n T_n Tn 表示第 n n n 个顾客到达时刻。易证 X n X_n Xn 为一个马尔科夫链。

各顾客服务时间独立,且服从参数为 μ \mu μ 的指数分布, ( 0 , t ) (0,t) (0,t) 时间内服务完的顾客服从参数为 μ \mu μ 的泊松分布,因此
P ( X n + 1 = i + 1 − j ∣ X n = i ) = ∫ 0 ∞ e − μ t ( μ t ) j j ! d G ( t ) P(X_{n+1}=i+1-j | X_n=i) = \int_0^\infty e^{-\mu t}\frac{(\mu t)^j}{j!} dG(t) P(Xn+1=i+1jXn=i)=0eμtj!(μt)jdG(t)

6.2 转移概率矩阵

定义:若 a i j ≥ 0 ,   i , j ∈ S a_{ij}\ge0, ~ i,j\in S aij0, i,jS 且满足 ∑ j ∈ S a i j = 1 \sum_{j\in S} a_{ij} = 1 jSaij=1,则称矩阵 A = ( a i j ) A=(a_{ij}) A=(aij) 为随机矩阵。

π i ( n ) = P ( X n = i ) \pi_i(n)=P(X_n=i) πi(n)=P(Xn=i),向量 π ( n ) = ( π 1 ( n ) , π 2 ( n ) , . . . ) \pi(n)=(\pi_1(n),\pi_2(n),...) π(n)=(π1(n),π2(n),...) 表示 n n n 时刻的概率分布向量。一个马尔科夫链的性质完全由初始分布向量和一步转移概率矩阵决定。

定理 6.2(C-K方程) P ( m + n ) = P ( m ) P ( n ) P^{(m+n)} = P^{(m)} P^{(n)} P(m+n)=P(m)P(n).

Remark:上面的C-K方程可以联想到卷积形式,即 P i j ( n ) = ∑ k P i k ( l ) P k j ( n − l ) P_{ij}^{(n)}=\sum_{k}P_{ik}^{(l)}P_{kj}^{(n-l)} Pij(n)=kPik(l)Pkj(nl),于是又可以联想到用傅里叶变换 / z变换进行处理,以避免卷积。

6.3 Markov链状态的分类

6.3.1 状态分类

定义:对于 i , j ∈ S i,j\in S i,jS,若存在自然数 n n n 使得 p i j ( n ) > 0 p_{ij}^{(n)} > 0 pij(n)>0,则称自状态 i i i 出发可达状态 j j j,记为 i → j i\to j ij。若 i → j i\to j ij j → i j\to i ji,则称 i , j i,j i,j 相通,记为 i ↔ j i\leftrightarrow j ij。如果 Markov 链的任意两个状态都相通,则称为不可约链

定义首达时间
τ i j = min ⁡ { n : n ≥ 1 , X n = j , X 0 = i } \tau_{ij}=\min \{n:n\ge1,X_n=j,X_0=i \} τij=min{n:n1,Xn=j,X0=i}
若右边为空集,则令 τ i j = ∞ \tau_{ij}=\infty τij=

定义首达概率
f i j ( n ) = P ( τ i j = n ∣ X 0 = i ) = P ( X n = j , X k ≠ j , 1 ≤ k ≤ n − 1 ∣ X 0 = i ) f_{ij}^{(n)}=P(\tau_{ij}=n | X_0=i)=P(X_n=j,X_k\ne j,1\le k\le n-1 | X_0=i) fij(n)=P(τij=nX0=i)=P(Xn=j,Xk=j,1kn1X0=i)
f i j = ∑ n = 1 ∞ f i j ( n ) f_{ij}=\sum_{n=1}^\infty f_{ij}^{(n)} fij=n=1fij(n) 表示从 i i i 出发,经有限步首次到达 j j j 的概率。

定义:若 f i i = 1 f_{ii}=1 fii=1,则称 i i i常返态;若 f i i < 1 f_{ii} < 1 fii<1,称状态 i i i 为非常返态。

定义:若 f i i = 1 f_{ii}=1 fii=1,此时定义 μ i = ∑ n = 1 ∞ n f i i ( n ) \mu_i=\sum_{n=1}^\infty nf_{ii}^{(n)} μi=n=1nfii(n),则 μ i \mu_i μi 表示从状态 i i i 出发再回到状态 i i i平均回转时间。若 μ i < ∞ \mu_i < \infty μi< i i i正常返态;若 μ i = ∞ \mu_i=\infty μi= 称为零常返态

定义:若集合 { n : n ≥ 1 , p i i ( n ) > 0 } ≠ ∅ \{n:n\ge1,p_{ii}^{(n)} > 0\}\ne\varnothing {n:n1,pii(n)>0}=,称该数集的最大公约数 d ( i ) d(i) d(i) 为状态 i i i 的周期。若 d ( i ) > 1 d(i) > 1 d(i)>1 称状态 i i i周期的;若 d ( i ) = 1 d(i)=1 d(i)=1 称为非周期的。

定义:若状态 i i i 为正常返态且为非周期的,则称状态 i i i遍历状态(ergodic state)。

6.3.2 一些基本关系式

定理 6.3:对 ∀ i , j ∈ S , n ≥ 1 \forall i,j\in S,n\ge1 i,jS,n1

  1. p i j ( n ) = ∑ l = 1 n f i j ( l ) p j j ( n − l ) p_{ij}^{(n)} = \sum_{l=1}^n f_{ij}^{(l)}p_{jj}^{(n-l)} pij(n)=l=1nfij(l)pjj(nl)
  2. f i j ( n ) = ∑ k ≠ j p i k f k j ( n − 1 ) I { n > 1 } + p i j I { n = 1 } f_{ij}^{(n)} = \sum_{k\ne j}p_{ik}f_{kj}^{(n-1)}I_{\{n > 1\}} + p_{ij} I_{\{n=1\}} fij(n)=k=jpikfkj(n1)I{n>1}+pijI{n=1}.

下面给出一些关于该定理的讨论。

Discussion(常返性判定准则):对于特殊情况 i = j i=j i=j 时,上面的第 1 条变成 p i i ( n ) = ∑ l = 1 n f i i ( l ) p i i ( n − l ) p_{ii}^{(n)} = \sum_{l=1}^n f_{ii}^{(l)}p_{ii}^{(n-l)} pii(n)=l=1nfii(l)pii(nl),这是卷积的形式,取 z 变换 P i ( z ) = ∑ n = 1 ∞ p i i ( n ) z − n P_i(z)=\sum_{n=1}^{\infty} p_{ii}^{(n)}z^{-n} Pi(z)=n=1pii(n)zn F i ( z ) = ∑ n = 1 ∞ f i i ( n ) z − n F_i(z)=\sum_{n=1}^{\infty}f_{ii}^{(n)}z^{-n} Fi(z)=n=1fii(n)zn,那么根据上式有 P i ( z ) = 1 + F i ( z ) P i ( z ) P_i(z)=1+F_i(z)P_i(z) Pi(z)=1+Fi(z)Pi(z),从而 P i ( z ) = 1 1 − F i ( z ) P_i(z)=\frac{1}{1-F_i(z)} Pi(z)=1Fi(z)1。当 z → 1 z\to1 z1时,有 P i ( z ) → ∑ n = 1 ∞ p i i ( n ) P_i(z)\to\sum_{n=1}^{\infty}p_{ii}^{(n)} Pi(z)n=1pii(n) F i ( z ) → ∑ n = 1 ∞ f i i ( n ) = f i i F_i(z)\to \sum_{n=1}^{\infty}f_{ii}^{(n)} = f_{ii} Fi(z)n=1fii(n)=fii

推论 6.3.1:状态 i i i 为常返的充要条件为 ∑ n = 1 ∞ p i i ( n ) = + ∞ \sum_{n=1}^{\infty}p_{ii}^{(n)}=+\infty n=1pii(n)=+;状态 i i i 非常返的充要条件为 ∑ n = 1 ∞ p i i ( n ) < ∞ \sum_{n=1}^{\infty}p_{ii}^{(n)} < \infty n=1pii(n)<

如果记 I n ( i ) = { 0 , X n ≠ i 1 , X n = i I_n(i)=\begin{cases}0,&X_n\ne i \\ 1,& X_n=i \end{cases} In(i)={0,1,Xn=iXn=i S ( i ) = ∑ n = 1 ∞ I n ( i ) S(i)=\sum_{n=1}^\infty I_n(i) S(i)=n=1In(i) 为到达状态 i i i 的次数,那么 E [ S ( i ) ∣ X 0 = i ] = ∑ n = 1 ∞ p i i ( n ) {\mathbb E}[S(i) | X_0=i]=\sum_{n=1}^{\infty}p_{ii}^{(n)} E[S(i)X0=i]=n=1pii(n) 即表示从状态 i i i 出发返回 i i i 的平均次数。当 i i i 为常返态,直观上即平均返回 i i i 的次数为无穷,与上面的推论是一致的。对于非常返态,平均返回次数有限。

Discussion( p i i ( n ) p_{ii}^{(n)} pii(n)与正常返、零常返的关系)

(1)当状态是非周期的,定义 v n = p i i ( n ) − p i i ( n − 1 ) , n > 1 v_n=p_{ii}^{(n)} - p_{ii}^{(n-1)},n > 1 vn=pii(n)pii(n1),n>1 v 0 = p i i ( 0 ) v_0=p_{ii}^{(0)} v0=pii(0),于是有 V ( z ) = ∑ n = 0 ∞ v n z − n = 1 − z − 1 1 − F i ( z ) V(z)=\sum_{n=0}^{\infty} v_nz^{-n} = \frac{1-z^{-1} }{1-F_i(z)} V(z)=n=0vnzn=1Fi(z)1z1,利用洛必达法则有 lim ⁡ z → 1 V ( z ) = − 1 / F i ′ ( 1 ) = 1 / μ i \lim_{z\to 1}V(z) = -1/F_i'(1) = 1/\mu_i limz1V(z)=1/Fi(1)=1/μi。另一方面 lim ⁡ z → 1 V ( z ) = lim ⁡ n → ∞ ∑ k = 0 ∞ v k = lim ⁡ n → ∞ p i i ( n ) \lim_{z\to1}V(z)=\lim_{n\to\infty}\sum_{k=0}^\infty v_k=\lim_{n\to\infty} p_{ii}^{(n)} limz1V(z)=limnk=0vk=limnpii(n),因此有
lim ⁡ n → ∞ p i i ( n ) = 1 / μ i \lim_{n\to\infty} p_{ii}^{(n)}=1/\mu_i nlimpii(n)=1/μi

根据正常返和零常返的定义知道:

i i i 是正常返时, lim ⁡ n → ∞ p i i ( n ) = 1 / μ i ≠ 0 \lim_{n\to\infty} p_{ii}^{(n)}=1/\mu_i\ne0 limnpii(n)=1/μi=0

i i i 是零常返时, lim ⁡ n → ∞ p i i ( n ) = 1 / μ i = 0 \lim_{n\to\infty} p_{ii}^{(n)}=1/\mu_i=0 limnpii(n)=1/μi=0

(2)当状态是周期的,记状态 i i i 的周期为 T T T,当 n n n 不是 T T T 的整数倍时有 f i i ( n ) = 0 f_{ii}^{(n)}=0 fii(n)=0 F i ( z ) = ∑ k = 0 ∞ f i i ( k T ) z − k T = ψ ( z T ) F_i(z)=\sum_{k=0}^\infty f_{ii}^{(kT)}z^{-kT}=\psi(z^T) Fi(z)=k=0fii(kT)zkT=ψ(zT),相应的 P i ( z ) = 1 1 − ψ ( z T ) P_i(z)=\frac{1}{1-\psi(z^T)} Pi(z)=1ψ(zT)1。类似非周期情况的讨论可以得到
p i i ( n T ) → T / μ i p_{ii}^{(nT)}\to T/\mu_i pii(nT)T/μi

i i i 是正常返时, lim ⁡ n → ∞ p i i ( n T ) = T / μ i ≠ 0 \lim_{n\to\infty} p_{ii}^{(nT)}=T/\mu_i\ne0 limnpii(nT)=T/μi=0 lim ⁡ n → ∞ p i i ( n T + k ) = 0 , 0 < k < T \lim_{n\to\infty} p_{ii}^{(nT+k)}=0,0 < k < T limnpii(nT+k)=0,0<k<T

i i i 是零常返时, lim ⁡ n → ∞ p i i ( n ) = 1 / μ i = 0 \lim_{n\to\infty} p_{ii}^{(n)}=1/\mu_i=0 limnpii(n)=1/μi=0

Discussion( p i j ( n ) p_{ij}^{(n)} pij(n)与正常返、零常返的关系):由于 p i j ( n ) = ∑ l = 1 n f i j ( l ) p j j ( n − l ) p_{ij}^{(n)} = \sum_{l=1}^n f_{ij}^{(l)}p_{jj}^{(n-l)} pij(n)=l=1nfij(l)pjj(nl),定义相应的 z 变换可以得到 P i j ( z ) = F i j ( z ) P j ( z ) = F i j ( z ) 1 − F j ( z ) P_{ij}(z)=F_{ij}(z)P_j(z) = \frac{F_{ij}(z)}{1-F_j(z)} Pij(z)=Fij(z)Pj(z)=1Fj(z)Fij(z)。当 j j j 为常返态时,利用洛必达法则有 lim ⁡ z → 1 + ( 1 − z − 1 ) P i j ( z ) = lim ⁡ z → 1 + 1 F j ′ ( z ) lim ⁡ z → 1 + F i j ( z ) = f i j / μ j \lim_{z\to1+}(1-z^{-1})P_{ij}(z) = \lim_{z\to1+}\frac{1}{F_j'(z)}\lim_{z\to1+}F_{ij}(z) = f_{ij}/\mu_j limz1+(1z1)Pij(z)=limz1+Fj(z)1limz1+Fij(z)=fij/μj,而左端等于(利用Hardy-Littlewood引理) lim ⁡ z → 1 + ( 1 − z − 1 ) P i j ( z ) = lim ⁡ n → ∞ 1 n + 1 ∑ k = 0 ∞ p i j ( k ) \lim_{z\to1+}(1-z^{-1})P_{ij}(z) = \lim_{n\to\infty} \frac{1}{n+1}\sum_{k=0}^\infty p_{ij}^{(k)} limz1+(1z1)Pij(z)=limnn+11k=0pij(k),因此有
lim ⁡ n → ∞ 1 n + 1 ∑ k = 0 ∞ p i j ( k ) = f i j μ j \lim_{n\to\infty} \frac{1}{n+1}\sum_{k=0}^\infty p_{ij}^{(k)} = \frac{f_{ij} }{\mu_j} nlimn+11k=0pij(k)=μjfij

j j j 是正常返时, lim ⁡ n → ∞ 1 n + 1 ∑ k = 0 ∞ p i j ( k ) = f i j / μ j \lim_{n\to\infty} \frac{1}{n+1}\sum_{k=0}^\infty p_{ij}^{(k)} = {f_{ij} }/{\mu_j} limnn+11k=0pij(k)=fij/μj 为有限值;

j j j 是零常返时, lim ⁡ n → ∞ 1 n + 1 ∑ k = 0 ∞ p i j ( k ) = 0 \lim_{n\to\infty} \frac{1}{n+1}\sum_{k=0}^\infty p_{ij}^{(k)}=0 limnn+11k=0pij(k)=0

6.3.3 状态间的等价关系

对马尔科夫链而言,状态互通是一种等价关系,对于状态进行归类有助于简化后续分析过程。

定理 6.4

  1. 若状态 i i i 常返,并且 i → j i\to j ij,则状态 j j j 也是常返的,并且 f j i = 1 f_{ji}=1 fji=1
  2. 如果 i ↔ j i\leftrightarrow j ij,则状态 i , j i,j i,j 同为常返或非常返态;若为常返态,则他们同为正常返或零常返;
  3. 如果 i ↔ j i\leftrightarrow j ij,则状态 i , j i,j i,j 有相同的周期。

证明:(1)存在 N N N 使得 p i j ( N ) > 0 p_{ij}^{(N)} > 0 pij(N)>0,从 i i i 出发到 j j j 不返回 i i i 的概率为 p i j ( N ) ( 1 − f j i ) = 0 p_{ij}^{(N)}(1-f_{ji})=0 pij(N)(1fji)=0,因此 f j i = 1 f_{ji}=1 fji=1。由于 i ↔ j i\leftrightarrow j ij,存在 N 1 , N 2 N_1,N_2 N1,N2 p i j ( N 1 ) > 0 , p j i ( N 2 ) > 0 p_{ij}^{(N_1)} > 0,p_{ji}^{(N_2)} > 0 pij(N1)>0,pji(N2)>0,那么 p j j ( N 1 + n + N 2 ) ≥ p i j ( N 1 ) p i i ( n ) p j i ( N 2 ) = a b p i i ( n ) p_{jj}^{(N_1+n+N_2)} \ge p_{ij}^{(N_1)}p_{ii}^{(n)}p_{ji}^{(N_2)}=abp_{ii}^{(n)} pjj(N1+n+N2)pij(N1)pii(n)pji(N2)=abpii(n),因此有 ∑ n = 0 ∞ p j j ( n ) = ∞ \sum_{n=0}^{\infty} p_{jj}^{(n)} = \infty n=0pjj(n)=,因此状态 j j j 是常返的。

(2,3)略。

最后给我的博客打个广告,欢迎光临
https://glooow1024.github.io/
https://glooow.gitee.io/

前面的一些博客链接如下
泛函分析专栏
高等数值分析专栏
随机过程专栏
随机过程1 绪论
随机过程2 平稳过程与二阶矩
离散鞅论1 | 基本概念
离散鞅论2 | 停时与停时定理
离散鞅论3 | 鞅论应用
泊松过程1 | 定义与基本性质
泊松过程2 | 泊松过程扩展
布朗运动 1 | 基本概念与性质
布朗运动 2 | 布朗运动的推广
马尔可夫过程1 | 基本概念
马尔可夫过程2 | 状态空间
连续参数马尔可夫链

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值