马尔可夫链原理

@BCKou

马尔可夫链模型

1.1 马尔可夫过程

马尔可夫过程(Markov process)是一个典型的随机过程

  • 打个比方,就像是一种漫步,没有既定的目标。每一步仅仅取决于前一步走到哪里,而且有若干个可能性。
  • 该过程是研究一个系统的状况及其转移的理论。
  • 它是通过对不同状态的初始概率以及状态之间的转移概率的研究,来确定状态的变化趋势,从而达到对未来进行预测的目的。

马尔可夫过程两个基本特征

  • 一:“无后效性”,即事务将来的状态及其出现的概率的大小,只取决于该事物现在所处的状态,而与以前时间的状态无关,即不依赖于它以往的演变;
  • 二:“遍历性”,是指不管事物现在处于什么状态,在较长时间内,马尔可夫过程逐渐趋于稳定状态,而且与初始状态无关。

在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所做的布朗运动、传染病受感染的人数、商品的存货问题、银行的排队等待人数等。

数学语言描述马尔可夫过程:
X ( t ) , t ∈ T X(t),t∈T X(t)tT为随机过程,若在 t 1 , t 2 , . . . , t n − 1 , t n ( t 1 < t 2 < . . . < t n − 1 < t n ∈ T ) t_1,t_2,...,t_{n-1},t_n(t_1<t_2<...<t_{n-1}<t_n∈T) t1,t2,...,tn1,tn(t1<t2<...<tn1<tnT)时刻对 X ( t ) X(t) X(t)观测得到相应的观测值 x 1 , x 2 , . . . , x n − 1 , x n x_1,x_2,...,x_{n-1},x_n x1,x2,...,xn1,xn满足条件
P { X ( t n ) ≤ x n ∣ X ( t n − 1 ) = x n − 1 , X ( t n − 2 ) = x n − 2 , . . . , X ( t 1 ) = x 1 } = P { X ( t n ) ≤ x n ∣ X ( t n − 1 ) = x n − 1 } P\{X(t_n)≤x_n|X(t_{n-1})=x_{n-1},X(t_{n-2})=x_{n-2},...,X(t_1)=x_1\}\\=P\{X(t_n)≤x_n|X(t_{n-1})=x_{n-1}\} P{X(tn)xnX(tn1)=xn1,X(tn2)=xn2,...,X(t1)=x1}=P{X(tn)xnX(tn1)=xn1}

F X ( x n ; t n ∣ x n − 1 , x n − 2 , . . . , x 2 , x 1 ; t n − 1 , t n − 2 , . . . , t 2 , t 1 ) = F X ( x n ; t n ∣ x n − 1 ; t n − 1 ) F_X(x_n;t_n|x_{n-1},x_{n-2},...,x_2,x_1;t_{n-1},t_{n-2},...,t_2,t_1)\\=F_X(x_n;t_n|x_{n-1};t_{n-1}) FX(xn;tnxn1,xn2,...,x2,x1;tn1,tn2,...,t2,t1)=FX(xn;tnxn1;tn1)
则称此过程为具有马尔可夫性质的过程或者马尔可夫过程,简称马氏过程。
其中
F X ( x n ; t n ∣ x n − 1 , x n − 2 , . . . , x 2 , x 1 ; t n − 1 , t n − 2 , . . . , t 2 , t 1 ) F_X(x_n;t_n|x_{n-1},x_{n-2},...,x_2,x_1;t_{n-1},t_{n-2},...,t_2,t_1) FX(xn;tnxn1,xn2,...,x2,x1;tn1,tn2,...,t2,t1)
代表在 X ( t n − 1 ) = x n − 1 , X ( t n − 2 ) = x n − 2 , . . . , X ( t 1 ) = x 1 X(t_{n-1})=x_{n-1},X(t_{n-2})=x_{n-2},...,X(t_1)=x_1 X(tn1)=xn1,X(tn2)=xn2,...,X(t1)=x1的条件下时刻 X ( t n ) X(t_n) X(tn) x n x_n xn值的条件分布函数。

若把 t n − 1 t_{n-1} tn1时刻看成“现在”,因为 t 1 < t 2 < . . . < t n − 1 < t n t_1<t_2<...<t_{n-1}<t_n t1<t2<...<tn1<tn,则 t n t_n tn就可以看成“将来”, t 1 , t 2 , . . . , t n − 2 t_1,t_2,...,t_{n-2} t1,t2,...,tn2就当做“过去”。因此上述定义可以表述为现在的状态 X ( t n − 1 ) X(t_{n-1}) X(tn1)取值为 x n − 1 x_{n-1} xn1的条件下,将来状态 X ( t n ) X(t_n) X(tn)的取值与过去状态 X ( t 1 ) , X ( t 2 ) , . . . , X ( t n − 2 ) X(t_1),X(t_2),...,X(t_{n-2}) X(t1),X(t2),...,X(tn2)的取值时无关的。

是不是所有的问题都可以套用马尔可夫过程?

  • 马尔可夫链需要追踪一个对象(如客户)随时间在不同状态间的流转,其行为有重复性。
  • 且客户每次只能选取一个状态:或停留在目前状态,或脱离目前状态,进入另一个状态。

1.2 马尔可夫链

马尔可夫链是一个预测工具。假定客户面临的选择空间可以划分 n 个互斥的状态,客户的长期动向可以用在不同状态间的转移来进行描述。

  • 转移具有两个重要的特征:随机,无后效(或称无记忆)。
    • 这种特性使得对客户长期行为的预测可以分割为若干个独立单元,每个时点的状态由前一刻所处状态和代表所有可能性的转移概率矩阵决定。

建立马尔可夫链模型步骤:

  • ① 设定状态
    • 状态可能是给定的,如不同品牌;或需要根据数据分析结果划分;
    • 当变量过多时,可以考虑聚类分析或者决策树
  • ② 计算转移概率矩阵
    • 在建造转移概率矩阵时,可以直接使用观察数据,或者专家意见赋值。
    • 也可以利用模型,如多状态逻辑回归、决策树、神经网络、或随机函数模型。
      • 模型的优点是可以剔除观察数据中的噪声,并细化转移概率,精确到人。
    • 马尔可夫模型假定客户在不同状态间的转移概率是恒定的,不随时间变化。所以对客户各个时点所处状态的估计通过单一转移矩阵的迭代来进行。
  • ③ 计算转移的结果

1.2.1 定义

马尔可夫链是指时间和状态参数都是离散的马尔可夫过程,它是最简单的马尔可夫过程。
一般的马尔可夫过程所研究的时间是无限的,是连续变量,其数值是连续不断地,相邻两值之间可作无限分割,且作研究的状态也是无限多的。
而马尔可夫链的时间参数取离散数值。

  • 在经济预测中,一般地时间取的是日、月、年。
  • 同时马尔可夫链的状态也是有限的。例如,市场销售状态可取“畅销”和“滞销”,两种,市场未来的状态只与现在所处状态有关,而与以前的状态无关(无后效性成立)。

数学语言描述为:
若随机过程 X ( n ) , n ∈ T X(n),n∈T X(n),nT满足条件:
(1)时间集合取非负整数集 T = { 0 , 1 , 2 , . . . } T=\{0,1,2,...\} T={0,1,2,...}对应每个时刻,状态空间是离散集,记作 E = { E 0 , E 1 , E 2 , . . . } E=\{E_0,E_1,E_2,...\} E={E0,E1,E2,...},即 X ( n ) X(n) X(n)是时间状态离散的。
(2)对任意的整数 n ∈ T n∈T nT,条件概率满足:
P { X ( n + 1 ) = E n + 1 ∣ X ( n ) = E n , X ( n − 1 ) = E n − 1 , . . . , X ( 0 ) = E 0 } = P { X ( n + 1 ) = E n ∣ X ( n ) = E n } P\{X(n+1)=E_{n+1}|X(n)=E_n,X(n-1)=E_{n-1},...,X(0)=E_0\}\\=P\{X(n+1)=E_n|X(n)=E_n\} P{X(n+1)=En+1X(n)=En,X(n1)=En1,...,X(0)=E0}=P{X(n+1)=EnX(n)=En}
则称 X ( n ) , n ∈ T X(n),n∈T X(n),nT为马尔可夫链,并记
P i j ( k ) = P { X ( m + k ) = E j ∣ X ( m ) = E i } , E i , E j ∈ E P_{ij}^{(k)}=P\{X(m+k)=E_j|X(m)=E_i\},E_i,E_j∈E Pij(k)=P{X(m+k)=EjX(m)=Ei},Ei,EjE
表示在时刻 m m m,系统处于状态 E i E_i Ei的条件下,在时刻 m + k m+k m+k,系统处于状态 E j E_j Ej下的概率。

条件概率等式,即 X ( n ) X(n) X(n)在时间 m + k m+k m+k的状态 X ( m + k ) = E j X(m+k)=E_j X(m+k)=Ej的概率只与时刻 m m m的状态 X ( m ) = E i X(m)=E_i X(m)=Ei有关,而与 m m m时以前的状态无关,它就是马氏性(无后效性)的数学表达式之一。

1.2.2 相关概念

1.状态与状态变量
状态:客观事物可能出现或存在的状况。例如,商品可能畅销也可能滞销;机器运转可能正常也可能故障等。
在同一事物不同状态之间必须互相独立:不能同时存在两种状态。客观事物的状态不是固定不变的,往往条件变化,状态也会发生变化。如某种产品在市场上本来是滞销的,但由于促销等因素,它便可能变为畅销产品。
一般用状态变量来表示状态: X i = i ( i = 1 , 2 , . . . , N t = 1 , 2 , . . . ) X_i=i\left(\begin{matrix}{i=1,2,...,N}\\{t=1,2,...}\end{matrix}\right) Xi=i(i=1,2,...,Nt=1,2,...),它表示随机运动系统,在时刻 t ( t = 1 , 2 , . . . ) t(t=1,2,...) t(t=1,2,...),所处的状态为 i ( i = 1 , 2 , . . . , N ) i(i=1,2,...,N) i(i=1,2,...,N)

2.状态转移概率及其转移概率矩阵
(1)*一步转移概率矩阵*。假设系统的状态空间为 E = ( E 1 , E 2 , . . . , E n ) E=(E_1,E_2,...,E_n) E=(E1,E2,...,En),而每一个时间系统只能处于其中一个状态,因此每一个状态都有 n n n个转向(包含转向自身),即 E i → E 1 , E i → E 2 , . . . , E i → E i , . . . , E i → E n E_i→E_1,E_i→E_2,...,E_i→E_i,...,E_i→E_n EiE1,EiE2,...,EiEi,...,EiEn
m m m时刻系统处于状态 E i E_i Ei的条件下,在 m + k m+k m+k时刻系统处于状态 E j E_j Ej下的条件概率可表示为:
P i j ( k ) = P { X ( m + k ) = E j ∣ X ( m ) = E i } , E i , E j ∈ E P_{ij}^{(k)}=P\{X(m+k)=E_j|X(m)=E_i\},E_i,E_j∈E Pij(k)=P{X(m+k)=EjX(m)=Ei},Ei,EjE
特别的,当 k = 1 k=1 k=1时,
P i j = P { X ( m + 1 ) = E j ∣ X ( m ) = E i } , E i , E j ∈ E P_{ij}=P\{X(m+1)=E_j|X(m)=E_i\},E_i,E_j∈E Pij=P{X(m+1)=EjX(m)=Ei},Ei,EjE
即在 m m m时刻系统处于状态 E i E_i Ei的条件下,在 m + 1 m+1 m+1时刻系统处于状态 E j E_j Ej下的条件概率,称为由状态 E i E_i Ei的转移概率。系统所有状态的一步概率的集合所组成的矩阵称为一步状态转移概率矩阵。其形式如下:
一步状态转移概率矩阵此矩阵具有以下两个性质:

  • ① 非负性: p i j ≥ 0 , i , j = 1 , 2 , . . . , n p_{ij}≥0,i,j=1,2,...,n pij0i,j=1,2,...,n
  • ② 行元素和为1,即
    ∑ j = 1 n p i j = 1 , i = 1 , 2 , . . . , n \sum_{j=1}^np_{ij}=1,i=1,2,...,n j=1npij=1,i=1,2,...,n
    (2)*k步转移概率矩阵*由一步转移概率的定义可知, k k k步转移概率就是系统由状态 E i E_i Ei k k k次转移到状态 E j E_j Ej的概率,可表示为
    P i j ( k ) = P { X ( m + k ) = E j ∣ X ( m ) = E i } , E i , E j ∈ E P_{ij}^{(k)}=P\{X(m+k)=E_j|X(m)=E_i\},E_i,E_j∈E Pij(k)=P{X(m+k)=EjX(m)=Ei},Ei,EjE
    因此,系统的 k k k步转移概率矩阵就是由所有状态的 k k k步转移概率集合所组成的矩阵。其形式如下:
    k步转移概率矩阵此矩阵具有以下三个性质:
  • ① 非负性:
    p i j ( k ) ≥ 0 , i , j = 1 , 2 , . . . , n p_{ij}^{(k)}≥0,i,j=1,2,...,n pij(k)0i,j=1,2,...,n
  • ② 行元素和为1,即
    ∑ j = 1 n p i j ( k ) = 1 , i = 1 , 2 , . . . , n \sum_{j=1}^np_{ij}^{(k)}=1,i=1,2,...,n j=1npij(k)=1i=1,2,...,n
  • P ( n ) = P ( n − 1 ) P = P n \mathbf{P}^{(n)}=\mathbf{P}^{(n-1)}\mathbf{P}=\mathbf{P}^{n} P(n)=P(n1)P=Pn

例题2-1:
有甲、乙、丙三家服装厂生产同一种服装,有1000个用户,假定在研究期间无新用户加入也无老用户退出,只有用户的转移。已知四月有400户是甲厂的顾客;500户是乙厂的顾客;100户是丙厂的顾客。五月,甲厂有300户原来的顾客,上月的顾客有50户转向乙厂,50户转向丙厂;乙厂有300户原来的顾客,上月的顾客有120户转向甲厂,80户转向丙厂;丙厂有60户原来的顾客,上月的顾客有20户转向甲厂,20户转向乙厂。
计算其状态转移概率。
解:
由题意得5月份顾客转移情况如表所示。
\quad 5月份顾客转移情况

类别合计
3005050400
12030080500
202060100
合计4403701901000

P 11 = 300 400 = 0.75 , P 12 = 50 400 = 0.125 , P 13 = 50 400 = 0.125 P 21 = 120 500 = 0.24 , P 22 = 300 500 = 0.6 , P 23 = 80 500 = 0.16 P 31 = 20 100 = 0.2 , P 32 = 20 100 = 0.2 , P 33 = 60 100 = 0.6 P_{11}=\frac{300}{400}=0.75,P_{12}=\frac{50}{400}=0.125,P_{13}=\frac{50}{400}=0.125\\ \quad\\ P_{21}=\frac{120}{500}=0.24,P_{22}=\frac{300}{500}=0.6,P_{23}=\frac{80}{500}=0.16\\ \quad\\ P_{31}=\frac{20}{100}=0.2,P_{32}=\frac{20}{100}=0.2,P_{33}=\frac{60}{100}=0.6\\ P11=400300=0.75P12=40050=0.125P13=40050=0.125P21=500120=0.24P22=500300=0.6P23=50080=0.16P31=10020=0.2P32=10020=0.2P33=10060=0.6
状态转移概率矩阵:
P = [ P 11 P 12 P 13 P 21 P 22 P 23 P 31 P 32 P 33 ] = [ 0.75 0.125 0.125 0.24 0.6 0.16 0.2 0.2 0.6 ] \mathbf{P}={\left[\begin{matrix}P_{11} & {P_{12}} & {P_{13}}\\ P_{21} & {P_{22}} & {P_{23}}\\ P_{31} & {P_{32}} & {P_{33}} \end{matrix}\right]}={\left[\begin{matrix}0.75 & 0.125& 0.125\\ 0.24 & 0.6 & 0.16 \\ 0.2 & 0.2 & 0.6 \end{matrix}\right]} P=P11P21P31P12P22P32P13P23P33=0.750.240.20.1250.60.20.1250.160.6

例题2-2:
某公司的市场有三种状态 E 1 、 E 2 、 E 3 E_1、E_2、E_3 E1E2E3(如畅销、一般、滞销),公司市场的转移情况如表所示。试求公司市场的两步状态转移概率矩阵。
表 公司市场状态转移情况
公司市场状态转移情况

解:
首先写出一步转移概率矩阵
P ( 1 ) = [ 0.500 0.167 0.333 0.444 0.222 0.334 0.500 0.400 0.100 ] \mathbf{P}^{(1)}={\left[\begin{matrix}0.500 & 0.167 & 0.333\\ 0.444 & 0.222 & 0.334 \\ 0.500 & 0.400 & 0.100 \end{matrix}\right]} P(1)=0.5000.4440.5000.1670.2220.4000.3330.3340.100
两步状态转移概率矩阵可由一步转移概率矩阵通过公式 P ( n ) = P n \mathbf{P}^{(n)}=\mathbf{P}^{n} P(n)=Pn计算求出:
P ( 2 ) = P 2 = [ 0.500 0.167 0.333 0.444 0.222 0.334 0.500 0.400 0.100 ] 2 = [ 0.491 0.254 0.255 0.488 0.257 0.255 0.478 0.212 0.310 ] \mathbf{P}^{(2)}=\mathbf{P}^{2}={\left[\begin{matrix}0.500 & 0.167 & 0.333\\ 0.444 & 0.222 & 0.334 \\ 0.500 & 0.400 & 0.100 \end{matrix}\right]}^{2}={\left[\begin{matrix}0.491 & 0.254 & 0.255\\ 0.488 & 0.257 & 0.255 \\ 0.478 & 0.212 & 0.310 \end{matrix}\right]} P(2)=P2=0.5000.4440.5000.1670.2220.4000.3330.3340.1002=0.4910.4880.4780.2540.2570.2120.2550.2550.310

3.稳态概率
马尔可夫链达到稳定状态时的状态概率就是稳定状态概率,也称为稳态概率。马尔可夫链在一定条件下,经过 k k k步转移后,会达到稳定状态。
(1)稳定状态的条件。如果一步转移概率矩阵是正规概率矩阵(正规矩阵在数学中是指与自己的共轭转置矩阵对应的复系数方块矩阵。),则马尔可夫链能够达到稳定状态。
(2)稳定概率的求解。由马尔可夫链稳定状态定义可知,处于稳定状态时,由 S ( k + 1 ) = S ( k ) \mathbf{S}^{(k+1)}=\mathbf{S}^{(k)} S(k+1)=S(k),即 S ( k + 1 ) = S ( k ) P = S ( k ) \mathbf{S}^{(k+1)} = \mathbf{S}^{(k)}\mathbf{P}=\mathbf{S}^{(k)} S(k+1)=S(k)P=S(k)
假设 { S ( k ) = ( x 1 , x 2 , . . . , x n ) S ( k + 1 ) = S ( k ) ⋅ P = S ( k ) \left\{ \begin{aligned} \mathbf{S}^{(k)} = (x_1,x_2,...,x_n)\\ \mathbf{S}^{(k+1)} = \mathbf{S}^{(k)}\mathbf{·}\mathbf{P}=\mathbf{S}^{(k)} \end{aligned} \right. {S(k)=(x1,x2,...,xn)S(k+1)=S(k)P=S(k),且 ∑ i = 1 n = 1 \sum_{i=1}^{n}=1 i=1n=1是经 k k k步转移后的状态向量,一步转移概率矩阵为
P = [ P 11 P 12 . . . P 1 n P 21 P 22 . . . P 2 n . . . . . . . . . . . . P n 1 P n 2 . . . P n n ] \mathbf{P}={\left[\begin{matrix}P_{11}\quad{P_{12}}\quad...\quad{P_{1n}}\\P_{21}\quad{P_{22}}\quad...\quad{P_{2n}}\\\\...\quad...\quad...\quad...\\\\P_{n1}\quad{P_{n2}}\quad...\quad{P_{nn}}\end{matrix}\right]} P=P11P12...P1nP21P22...P2n............Pn1Pn2...Pnn
根据 S ( k + 1 ) = S ( k ) ⋅ P = S ( k ) \mathbf{S}^{(k+1)} = \mathbf{S}^{(k)}\mathbf{·}\mathbf{P}=\mathbf{S}^{(k)} S(k+1)=S(k)P=S(k)展开为
( x 1 , x 2 , . . . , x n ) [ P 11 P 12 . . . P 1 n P 21 P 22 . . . P 2 n . . . . . . . . . . . . P n 1 P n 2 . . . P n n ] = S ( k ) = ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n){\left[\begin{matrix}P_{11}\quad{P_{12}}\quad...\quad{P_{1n}}\\P_{21}\quad{P_{22}}\quad...\quad{P_{2n}}\\\\...\quad...\quad...\quad...\\\\P_{n1}\quad{P_{n2}}\quad...\quad{P_{nn}}\end{matrix}\right]}=\mathbf{S}^{(k)}=(x_1,x_2,...,x_n) (x1,x2,...,xn)P11P12...P1nP21P22...P2n............Pn1Pn2...Pnn=S(k)=(x1,x2,...,xn)
通过计算,得出如下方程组:
{ P 11 x 1 + P 21 x 2 + . . . + P n 1 x n = x 1 P 12 x 1 + P 22 x 2 + . . . + P n 2 x n = x 2 . . . P 1 n x 1 + P 2 n x 2 + . . . + P n n x n = x n x 1 + x 2 + . . . + x n = 1 \left\{ \begin{aligned} P_{11}x_1+P_{21}x_2+...+P_{n1}x_n=x_1\\ P_{12}x_1+P_{22}x_2+...+P_{n2}x_n=x_2\\ ...\\ P_{1n}x_1+P_{2n}x_2+...+P_{nn}x_n=x_n\\ x_1+x_2+...+x_n=1 \end{aligned} \right. P11x1+P21x2+...+Pn1xn=x1P12x1+P22x2+...+Pn2xn=x2...P1nx1+P2nx2+...+Pnnxn=xnx1+x2+...+xn=1
移项得
{ ( P 11 − 1 ) x 1 + P 21 x 2 + . . . + P n 1 x n = 0 P 12 x 1 + ( P 22 − 1 ) x 2 + . . . + P n 2 x n = 0 . . . P 1 n x 1 + P 2 n x 2 + . . . + ( P n n − 1 ) x n = 0 x 1 + x 2 + . . . + x n = 1 \left\{ \begin{aligned} (P_{11}-1)x_1+P_{21}x_2+...+P_{n1}x_n=0\\ P_{12}x_1+(P_{22}-1)x_2+...+P_{n2}x_n=0\\ ...\\ P_{1n}x_1+P_{2n}x_2+...+(P_{nn}-1)x_n=0\\ x_1+x_2+...+x_n=1 \end{aligned} \right. (P111)x1+P21x2+...+Pn1xn=0P12x1+(P221)x2+...+Pn2xn=0...P1nx1+P2nx2+...+(Pnn1)xn=0x1+x2+...+xn=1
上式中存在 n n n个变量,却有 n + 1 n+1 n+1个方程,说明其中一个方程不独立,需要消去其中第 n n n个方程:
[ ( P 11 − 1 ) P 21 . . . P n 1 P 12 ( P 22 − 1 ) . . . P n 2 . . . . . . . . . . . . P 1 n P 2 n . . . P n n 1 1 . . . 1 ] [ x 1 x 2 . . . x n ] = [ 0 0 . . . 1 ] {\left[\begin{matrix}(P_{11}-1) & {P_{21}} & ...& {P_{n1}}\\ P_{12} & {(P_{22}-1)} & ...& {P_{n2}}\\ ... & ...& ...&...&\\ P_{1n} & {P_{2n}} & ... & {P_{nn}}\\ 1&1&...&1 \end{matrix}\right]} {\left[\begin{matrix}x_1\\ x_2\\ ... \\ x_n \end{matrix}\right]}= {\left[\begin{matrix}0\\ 0\\ ... \\ 1 \end{matrix}\right]} (P111)P12...P1n1P21(P221)...P2n1...............Pn1Pn2...Pnn1x1x2...xn=00...1

P 1 = [ ( P 11 − 1 ) P 21 . . . P n 1 P 12 ( P 22 − 1 ) . . . P n 2 . . . . . . . . . . . . P 1 n P 2 n . . . ( P n n − 1 ) 1 1 . . . 1 ] , X ( n ) = [ x 1 x 2 . . . x n ] , B = [ 0 0 . . . 1 ] \mathbf{P}_1={\left[\begin{matrix}(P_{11}-1) & {P_{21}} & ...& {P_{n1}}\\ P_{12} & {(P_{22}-1)} & ...& {P_{n2}}\\ ... & ...& ...&...&\\ P_{1n} & {P_{2n}} & ... & {(P_{nn}-1)}\\ 1&1&...&1 \end{matrix}\right]},\mathbf{X}^{(n)}={\left[\begin{matrix}x_1\\ x_2\\ ... \\ x_n \end{matrix}\right]},\mathbf{B}={\left[\begin{matrix}0\\ 0\\ ... \\ 1 \end{matrix}\right]} P1=(P111)P12...P1n1P21(P221)...P2n1...............Pn1Pn2...(Pnn1)1X(n)=x1x2...xnB=00...1
P 1 X ( n ) = B X ( n ) = P 1 ( − 1 ) B \quad\mathbf{P}_1\mathbf{X}^{(n)}=\mathbf{B}\\ \quad\quad\mathbf{X}^{(n)}=\mathbf{P}_1^{(-1)}\mathbf{B} \quad P1X(n)=BX(n)=P1(1)B
即求得 X ( n ) \mathbf{X}^{(n)} X(n)是马尔可夫链得稳态概率。

1.3 马尔科夫链模型的分类

1.3.1 连续时间马尔科夫链

定义:设随机过程 { X ( t ) , t ≥ 0 } \{\mathbf{X}(t),t≥0\} {X(t),t0},状态空间 I = { i n , n ≥ 0 } I=\{i_n,n≥0\} I={in,n0},若对任意 0 ≤ t 1 < t 2 < . . . < t n + 1 0≤t_1<t_2<...<t_{n+1} 0t1<t2<...<tn+1 i 1 , i 2 , . . . , i n + 1 ∈ I i_1,i_2,...,i_{n+1}∈I i1,i2,...,in+1I,有
P { X ( t n + 1 ) = i n + 1 ∣ X ( t 1 ) = i 1 , X ( t 2 ) = i 2 , . . . , X ( t n ) = i n } = P { X ( t n + 1 ) = i n + 1 ∣ X ( t n ) = i n } P\{X(t_{n+1})=i_{n+1}|X(t_1)=i_1,X(t_2)=i_2,...,X(t_n)=i_n\}\\=P\{X(t_{n+1})=i_{n+1}|X(t_{n})=i_n\} P{X(tn+1)=in+1X(t1)=i1,X(t2)=i2,...,X(tn)=in}=P{X(tn+1)=in+1X(tn)=in}
则称 { X ( t ) , t ≥ 0 } \{X(t),t≥0\} {X(t),t0}为连续时间马尔可夫链。
上式中条件概率的一般表现形式为
P { X ( s + t ) = j ∣ X ( s ) = i } = p i j ( s , t ) P\{X(s+t)=j| X(s)=i\}= p_{ij}(s,t) P{X(s+t)=jX(s)=i}=pij(s,t)
定义:若 p i j ( s , t ) p_{ij}(s,t) pij(s,t)的转移概率与 s s s无关,则称连续时间马尔可夫链具有平稳的或齐次的转移概率,此时转移概率简记为
p i j ( s , t ) = p i j ( t ) p_{ij}(s,t)=p_{ij}(t) pij(s,t)=pij(t)
其转移概率矩阵简记为
P ( t ) = ( p i j ( t ) ) \mathbf{P}(t)=(p_{ij}(t)) P(t)=(pij(t))
一个连续时间的马尔可夫链,每当它进人状态 i i i,具有如下性质:
(1)在转移到另一状态之前处于状态 i i i的时间服从参数为 v i v_i vi的指数分布;
(2)当过程离开状态 i i i时,接着以概率 p i j p_{ij} pij进人状态 j j j ∑ j ≠ i p i j = 1 {\sum_{j≠i}}p_{ij}=1 j=ipij=1
v i = ∞ v_i = ∞ vi=时,称状态 i i i为瞬时状态;
v i = 0 v_i = 0 vi=0时,称状态 i i i为吸收状态。
一个连续时间马尔可夫链是按照一个离散时间的马尔可夫链从一个状态转移到另一个状态,但在转移到下一个状态之前,它在各个状态停留的时间服从指数分布,此外在状态 i i i过程停留的时间与下一个到达的状态必须是相互独立的随机变量。

1.3.2 隐马尔可夫模型

隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每–个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程——具有定状态数的隐 马尔可夫链和显示随机函数集。

  • 自20世纪以来 ,隐马尔可夫模型被应用于语音识别、计算机文字识别、移动通信核心技术“多用户的检测”以及生物信息科学、故障诊断等领域。

隐马尔可夫模型(HMM)可以用5个元素来描述,包括2个状态集合和3个概率矩阵。

  • (1)隐含状态 S \mathbf{S} S。这些状态之间满足马尔可夫性质,是马尔可夫模型中实际所隐含的状态。这些状态通常无法通过直接观测而得到(如 S 1 , S 2 , S 3 S_1,S_2,S_3 S1,S2,S3等)。
  • (2)可观测状态 O \mathbf{O} O。在模型中与隐含状态相关联,可通过直接观测而得到。(如如 O 1 , O 2 , O 3 O_1,O_2,O_3 O1,O2,O3等,可观测状态的数目不一定要和隐含状态的数目一致。)
  • (3)初始状态概率矩阵 Π \mathbf{Π} Π。表示隐含状态在初始时刻 t = 1 t=1 t=1的概率矩阵,如 t = 1 t=1 t=1时, P ( S 1 ) = p 1 , P ( S 2 ) = p 2 , P ( S 3 ) = p 3 P(S_1)=p_1,P(S_2)=p_2,P(S_3)=p_3 P(S1)=p1,P(S2)=p2,P(S3)=p3,则初始状态概率矩阵 Π = [ p 1 , p 2 , p 3 ] \mathbf{Π}=[p_1,p_2,p_3] Π=[p1,p2,p3]
  • (4)隐含状态转移概率矩阵 A \mathbf{A} A。它描述了隐马尔可夫模型中各个状态之间的转移概率。其中 A i j = P ( S j ∣ S i ) , 1 ≤ i , j ≤ N A_ij=P(S_j|S_i),1≤i,j≤N Aij=P(SjSi),1i,jN,表示在 t t t时刻、状态为 S i S_i Si的条件下,在 t + 1 t+1 t+1时刻状态是 S j S_j Sj的概率。
  • (5)观测状态转移概率矩阵 B \mathbf{B} B.令 N N N代表隐含状态数目, M M M代表可观测状态数目,则 B i j = P ( O i ∣ S j ) , 1 ≤ i ≤ M , 1 ≤ j ≤ N B_{ij}=P(O_i|S_j),1≤i≤M,1≤j≤N Bij=P(OiSj),1iM,1jN表示在 t t t时刻、隐含状态时 S j S_j Sj条件下,观察状态为 O i O_i Oi的概率。

可以用 λ = ( A , B , Π ) \lambda=(\mathbf{A},\mathbf{B},\mathbf{Π}) λ=(A,B,Π)三元组来简介地表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态直接按的概率关系。

1.4 马尔科夫链模型的应用

马尔可夫分析法(Markovanalysis)又称为马尔可夫转移矩阵法,是指在马尔可夫过程的假设前提下,通过分析随机变量的现时变化情况来预测这些变量
未来变化情况的种预测方法。

马尔可夫链预测方法的最简单类型是预测下期最可能出现的状态。步骤如下:

  • 第一步:划分预测对象所出现的状态。从预测目的出发,考虑决策需要来划分现象所处的状态。
  • 第二步:计算初始概率。据实际问题分析历史资料所得的状态概率称为初始概率。
  • 第三步:计算状态转移概率。
  • 第四步:根据转移概率进行预测。

由状态转移概率矩阵 P \mathbf{P} P,如果目前预测对象处于状态 E i E_i Ei,这时 P i j P_{ij} Pij就描述了目前状态 E i E_i Ei在未来将转向状态 E j ( j = 1 , 2 , . . . , N ) E_j(j =1,2,...,N) Ej(j=1,2,...,N)的可能性。按最大可能性作为选择原则:选择 P j 1 , P j 2 , . . . , P j N , P_{j1},P_{j2},...,P_{jN}, Pj1,Pj2,...,PjN,中最大者为预测结果。

应用一:计算市场占有率

广州、深圳和我国澳门特区生产并销售某种食材,要预测在未来若干个月以后的市场占有情况。具体步骤为:

第一步:进行市场调查

  • (1)目前市场占有情况(顾客购买广州、深圳、我国澳门特区食材的比例)。
    结果:购买广州食材的占40%,买深圳、我国澳门特区的各占30%,(40%、30%、30%)称为目前市场的占有分布或称初始分布。
  • (2)调查顾客的流动情况。
    流动情况为:
    • ①上月购买广州食材的顾客,本月仍有40%继续购买,各有30%转向购买深圳和我国澳门特区食材。
    • ②上月购买深圳食材的顾客,本月有60%转向购买广州食材,30%仍购买深圳食材,10%转向购买我国澳门特区食材。
    • ③上月购买我国澳门特区食材的顾客,本月有60%转向购买广州食材,10%转向鹏买深圳食材,30%仍购买我国澳门特区食材。

第二步:建立数学模型

为运算方便,以1、2、3分别代表广州、深圳、我国澳门特区食材,根据市场调查的结果,得到顾客购买食材的流动情况如表所示,

表 顾客购买食材的流动情况

类比广州深圳我国澳门特区
广州40%30%30%
深圳60%30%10%
澳门60%10%30%

P = [ P 11 P 12 P 13 P 21 P 22 P 23 P 31 P 32 P 33 ] = [ 0.4 0.3 0.3 0.6 0.3 0.1 0.6 0.1 0.3 ] \mathbf{P}={\left[\begin{matrix}P_{11} & {P_{12}} & {P_{13}}\\ P_{21} & {P_{22}} & {P_{23}}\\ P_{31} & {P_{32}} & {P_{33}} \end{matrix}\right]}={\left[\begin{matrix}0.4 & 0.3& 0.3\\ 0.6& 0.3 & 0.1\\ 0.6 & 0.1 & 0.3 \end{matrix}\right]} P=P11P21P31P12P22P32P13P23P33=0.40.60.60.30.30.10.30.10.3

第三步:进行市场预测
设初始市场占有的分布情况为 ( P 1 , P 2 , P 3 ) = ( 0.4 , 0.3 , 0.3 ) (P_1,P_2,P_3)=(0.4,0.3,0.3) (P1,P2,P3)=(0.4,0.3,0.3),三个月以后的市场占有分布是 ( P 1 ( 3 ) , P 2 ( 3 ) , P 3 ( 3 ) ) (P_1(3),P_2(3),P_3(3)) (P1(3),P2(3),P3(3))
如果顾客流动趋势长期稳定下去,则经过一段时期以后的市场占有率将出现稳定的平衡状态。
( P 1 ( n ) , P 2 ( n ) , P 3 ( n ) ) = ( P 1 , P 2 , P 3 ) [ P 11 ( n ) P 12 ( n ) P 13 ( n ) P 21 ( n ) P 22 ( n ) P 23 ( n ) P 31 ( n ) P 32 ( n ) P 33 ( n ) ] = ( P 1 , P 2 , P 3 ) [ P 11 P 12 P 13 P 21 P 22 P 23 P 31 P 32 P 33 ] n (P_1(n),P_2(n),P_3(n))=(P_1,P_2,P_3){\left[\begin{matrix}P_{11}(n) & {P_{12}}(n) & {P_{13}}(n)\\ P_{21}(n) & {P_{22}}(n) & {P_{23}}(n)\\ P_{31}(n) & {P_{32}}(n) & {P_{33}}(n) \end{matrix}\right]}\\ \quad\\ =(P_1,P_2,P_3){\left[\begin{matrix}P_{11}& {P_{12}} & {P_{13}}\\ P_{21} & {P_{22}} & {P_{23}}\\ P_{31} & {P_{32}} & {P_{33}} \end{matrix}\right]}^n (P1(n),P2(n),P3(n))=(P1,P2,P3)P11(n)P21(n)P31(n)P12(n)P22(n)P32(n)P13(n)P23(n)P33(n)=(P1,P2,P3)P11P21P31P12P22P32P13P23P33n
所谓稳定的市场平衡状态,指在顾客流动过程中,每种产品丧失的顾客数与新增的顾客数量相抵消。

第四步:预测长期的市场占有率

由于一步转移概率矩阵 P P P是正规概率矩阵,所以长期的市场占有率为平衡状态下的市场占有率,亦即马尔可夫链的平稳分布。
设长期的市场占有率为 X = ( x 1 , x 2 , x 3 ) \mathbf{X}=(x_1,x_2,x_3) X=(x1,x2,x3),则有
{ ( x 1 , x 2 , x 3 ) [ 0.4 0.3 0.3 0.6 0.3 0.1 0.6 0.1 0.3 ] = ( x 1 , x 2 , x 3 ) x 1 + x 2 + . . . + x n = 1 \left\{ \begin{aligned} (x_1,x_2,x_3){\left[\begin{matrix}0.4 & 0.3& 0.3\\ 0.6& 0.3 & 0.1\\ 0.6 & 0.1 & 0.3 \end{matrix}\right]}=(x_1,x_2,x_3)\\ x_1+x_2+...+x_n=1 \end{aligned} \right. (x1,x2,x3)0.40.60.60.30.30.10.30.10.3=(x1,x2,x3)x1+x2+...+xn=1
X = ( x 1 , x 2 , x 3 ) = ( 0.5 , 0.25 , 0.25 ) \mathbf{X}=(x_1,x_2,x_3)=(0.5,0.25,0.25) X=(x1,x2,x3)=(0.5,0.25,0.25)

应用二:人力资源预测

某公司职工级别分为5种:实习生、普通职工、总监、总经理、离职。目前状态(550人): P ( 0 ) = ( 135 , 240 , 115 , 60 , 0 ) \mathbf{P}(0)=(135,240,115,60,0) P(0)=(135,240,115,60,0)
公司以往的记录为
P = [ 0.6 0.4 0 0 0 0 0.6 0.25 0 0.15 0 0 0.55 0.21 0.24 0 0 0 0.8 0.2 0 0 0 0 1 ] \mathbf{P}={\left[\begin{matrix}0.6 & 0.4 & 0 & 0 & 0\\ 0 & 0.6 & 0.25 & 0 & 0.15\\ 0 & 0 & 0.55 & 0.21 & 0.24\\ 0 & 0 & 0 & 0.8 & 0.2\\ 0 & 0 & 0 & 0 & 1\end{matrix}\right]} P=0.600000.40.600000.250.5500000.210.8000.150.240.21
试分析三年后职工结构以及三年内保持职工分布不变(550名)应招聘多少新员工充实金职工队伍。

解:
一年后职工人员分布:
P ( 1 ) = P ( 0 ) ⋅ P = ( 135 , 240 , 115 , 60 , 0 ) [ 0.6 0.4 0 0 0 0 0.6 0.25 0 0.15 0 0 0.55 0.21 0.24 0 0 0 0.8 0.2 0 0 0 0 1 ] = ( 81 , 198 , 123 , 72 , 76 ) \mathbf{P}(1)=\mathbf{P}(0)\mathbf{·}\mathbf{P}\\ \quad\\=(135,240,115,60,0){\left[\begin{matrix}0.6 & 0.4 & 0 & 0 & 0\\ 0 & 0.6 & 0.25 & 0 & 0.15\\ 0 & 0 & 0.55 & 0.21 & 0.24\\ 0 & 0 & 0 & 0.8 & 0.2\\ 0 & 0 & 0 & 0 & 1\end{matrix}\right]}\\ \quad\\=(81,198,123,72,76) P(1)=P(0)P=(135,240,115,60,0)0.600000.40.600000.250.5500000.210.8000.150.240.21=(81,198,123,72,76)
要保持550名的总人数,离职76人,故第二年应招聘76位新员工:
P ′ ( 1 ) = ( 81 + 76 , 198 , 123 , 72 , 0 ) \mathbf{P}'(1)=(81+76,198,123,72,0) P(1)=(81+76,198,123,72,0)
第二年后职工人员分布:
P ( 2 ) = P ′ ( 1 ) ⋅ P = ( 157 , 198 , 123 , 72 , 76 ) [ 0.6 0.4 0 0 0 0 0.6 0.25 0 0.15 0 0 0.55 0.21 0.24 0 0 0 0.8 0.2 0 0 0 0 1 ] = ( 94 , 182 , 117 , 83 , 74 ) \mathbf{P}(2)=\mathbf{P}'(1)\mathbf{·}\mathbf{P}\\ \quad\\=(157,198,123,72,76){\left[\begin{matrix}0.6 & 0.4 & 0 & 0 & 0\\ 0 & 0.6 & 0.25 & 0 & 0.15\\ 0 & 0 & 0.55 & 0.21 & 0.24\\ 0 & 0 & 0 & 0.8 & 0.2\\ 0 & 0 & 0 & 0 & 1\end{matrix}\right]}\\ \quad\\=(94,182,117,83,74) P(2)=P(1)P=(157,198,123,72,76)0.600000.40.600000.250.5500000.210.8000.150.240.21=(94,182,117,83,74)
要保持总人数不变,应补充74人:
P ′ ( 2 ) = ( 94 + 74 , 182 , 117 , 83 , 0 ) \mathbf{P}'(2)=(94+74,182,117,83,0) P(2)=(94+74,182,117,83,0)
第三年后职工人员分布:
P ( 3 ) = P ′ ( 2 ) ⋅ P = ( 168 , 182 , 117 , 83 , 0 ) [ 0.6 0.4 0 0 0 0 0.6 0.25 0 0.15 0 0 0.55 0.21 0.24 0 0 0 0.8 0.2 0 0 0 0 1 ] = ( 101 , 176 , 111 , 91 , 72 ) \mathbf{P}(3)=\mathbf{P}'(2)\mathbf{·}\mathbf{P}\\ \quad\\=(168,182,117,83,0){\left[\begin{matrix}0.6 & 0.4 & 0 & 0 & 0\\ 0 & 0.6 & 0.25 & 0 & 0.15\\ 0 & 0 & 0.55 & 0.21 & 0.24\\ 0 & 0 & 0 & 0.8 & 0.2\\ 0 & 0 & 0 & 0 & 1\end{matrix}\right]}\\ \quad\\=(101,176,111,91,72) P(3)=P(2)P=(168,182,117,83,0)0.600000.40.600000.250.5500000.210.8000.150.240.21=(101,176,111,91,72)
补充72人。在第三年年底,职工人员结构为:
P ′ ( 3 ) = ( 173 , 176 , 111 , 91 , 0 ) \mathbf{P}'(3)=(173,176,111,91,0) P(3)=(173,176,111,91,0)
应用三:利润预测
在第 n n n周期的状态用 X n X_n Xn表示:
X n = { 1 , 第 n 周 期 产 品 畅 销 2 , 第 n 周 期 产 品 滞 销 X_n=\left\{ \begin{aligned} 1,第n周期产品畅销\\ 2,第n周期产品滞销 \end{aligned} \right. Xn={1n2n
一般地,设 { X n } \{X_n\} {Xn}是状态空间为 S = { 1 , 2 , . . . , N } S=\{1,2,...,N\} S={1,2,...,N}的齐次马氏链,其转移矩阵为 P = ( P i j ) N ✖ N \mathbf{P}=(P_{ij})_{N✖N} P=(Pij)NN

r ( i ) r(i) r(i)表示周期系统处于状态 i i i时获得的收益。称如此的马尔可夫链具有收益的。 r ( i ) > 0 r(i)>0 r(i)>0时称为收益; r ( i ) < 0 r(i)<0 r(i)<0时称为费用。

(1)有限时段期望总收益。记 v k ( i ) v_k(i) vk(i)表示初始状态为 i i i的条件下,到第 k k k步状态转移前所获得得期望总收益( k ≥ 1 , i ∈ S k≥1,i∈S k1,iS):
v k ( i ) = ∑ n = 0 k − 1 第 n 周 期 的 期 望 收 益 = ∑ n = 0 k − 1 E { r ( X n ) ∣ X 0 = i } = ∑ n = 0 k − 1 ( ∑ j = 1 N p i j ( n ) r ( j ) ) v_k(i)=\sum_{n=0}^{k-1}第n周期的期望收益\\=\sum_{n=0}^{k-1}E\{r(X_n)|X_0=i\}\\=\sum_{n=0}^{k-1}(\sum_{j=1}^{N}p_{ij}^{(n)}r(j)) vk(i)=n=0k1n=n=0k1E{r(Xn)X0=i}=n=0k1(j=1Npij(n)r(j))
以下面例题说明, k = 4 k=4 k=4,以当前月份记为第一个月,求第四步状态转移前(即前四个月)所获得得期望利润 v 4 ( 1 ) v_4(1) v4(1)
r ( i ) r(i) r(i)表示某周期系统处于状态 i i i时获得得收益,用1表示畅销,2表示滞销。则
v 4 ( 1 ) = r ( 1 ) + ∑ n = 1 4 − 1 [ p 11 ( n ) r ( 1 ) + p 12 ( n ) r ( 2 ) ] v 4 ( 2 ) = r ( 2 ) + ∑ n = 1 4 − 1 [ p 21 ( n ) r ( 1 ) + p 22 ( n ) r ( 2 ) ] V 4 = ( v 4 ( 1 ) , v 4 ( 2 ) ) T P n = [ p 11 ( n ) p 12 ( n ) p 21 ( n ) p 22 ( n ) ] r = ( r ( 1 ) , r ( 2 ) ) T V 4 = r + ∑ n = 1 4 − 1 P ( n ) r = ∑ n = 1 4 − 1 P ( n ) r = ∑ n = 1 4 − 1 P n r = ( ∑ n = 1 4 − 1 P n ) r = ( E + P + P 2 + P 3 ) r v_4(1)=r(1)+\sum_{n=1}^{4-1}[p_{11}^{(n)}r(1)+p_{12}^{(n)}r(2)]\\ \quad\\ v_4(2)=r(2)+\sum_{n=1}^{4-1}[p_{21}^{(n)}r(1)+p_{22}^{(n)}r(2)]\\ \quad\\ \mathbf{V}_4=(v_4(1),v_4(2))^T\\ \quad\\ \mathbf{P}^{n}={\left[\begin{matrix}p_{11}^{(n)} & p_{12}^{(n)}\\ \quad\\ p_{21}^{(n)} & p_{22}^{(n)} \end{matrix}\right]}\\ \quad\\ \mathbf{r}=(r(1),r(2))^T\\ \quad\\ \mathbf{V}_4=\mathbf{r}+\sum_{n=1}^{4-1}\mathbf{P}^{(n)}\mathbf{r}=\sum_{n=1}^{4-1}\mathbf{P}^{(n)}\mathbf{r}=\sum_{n=1}^{4-1}\mathbf{P}^{n}\mathbf{r}\\=(\sum_{n=1}^{4-1}\mathbf{P}^{n})\mathbf{r}=(\mathbf{E}+\mathbf{P}+\mathbf{P}^2+\mathbf{P}^3)\mathbf{r} v4(1)=r(1)+n=141[p11(n)r(1)+p12(n)r(2)]v4(2)=r(2)+n=141[p21(n)r(1)+p22(n)r(2)]V4=(v4(1),v4(2))TPn=p11(n)p21(n)p12(n)p22(n)r=(r(1),r(2))TV4=r+n=141P(n)r=n=141P(n)r=n=141Pnr=(n=141Pn)r=(E+P+P2+P3)r
(2)无限时段单位时间平均收益
i ∈ S i∈S iS,定义初始状态为 i i i得无限时段单位时间平均收益为
v ( i ) = lim ⁡ k → ∞ V k ( i ) k v(i)=\lim_{k→∞}\frac{V_k(i)}{k} v(i)=klimkVk(i)
v = [ v ( 1 ) v ( 2 ) . . . v ( N ) ] T , V k = ( v k ( 1 ) , ( v k ( 2 ) , . . . , ( v k ( N ) ) T V k = ∑ n = 0 k − 1 P n r = ( E + P + P 2 + . . . + P k − 1 ) r \mathbf{v}=[v(1)\quad v(2) \quad ...\quad v(N)]^T,\mathbf{V}_k=(v_k(1),(v_k(2),...,(v_k(N))^T\\ \quad\\ \mathbf{V}_k=\sum_{n=0}^{k-1}\mathbf{P}^{n}\mathbf{r}=(\mathbf{E}+\mathbf{P}+\mathbf{P}^2+...+\mathbf{P}^{k-1})\mathbf{r} v=[v(1)v(2)...v(N)]T,Vk=(vk(1),(vk(2),...,(vk(N))TVk=n=0k1Pnr=(E+P+P2+...+Pk1)r
V = lim ⁡ k → ∞ V k k = lim ⁡ k → ∞ ( E + P + P 2 + . . . + P k − 1 ) r K V=\lim_{k→∞}\frac{V_k}{k}=\lim_{k→∞}\frac{({E}+{P}+{P}^2+...+{P}^{k-1}){r}}{K} V=klimkVk=klimK(E+P+P2+...+Pk1)r
若所考虑的马尔可夫链存在平稳分布
P m = [ p 11 ( m ) p 12 ( m ) . . . p 1 N ( m ) p 21 ( m ) p 22 ( m ) . . . p 2 N ( m ) . . . . . . . . . . . . p N 1 ( m ) p N 2 ( m ) . . . p N N ( m ) ] → [ π 1 π 2 . . . π N π 1 π 2 . . . π N . . . . . . . . . . . . π 1 π 2 . . . π N ] \mathbf{P}^m={\left[\begin{matrix} p_{11}^{(m)}&{p_{12}}^{(m)}&...&{p_{1N}}^{(m)}\\ \quad\\ p_{21}^{(m)}&{p_{22}}^{(m)}&...&{p_{2N}}^{(m)}\\ \quad\\ ...&...&...&...\\ \quad\\ p_{N1}^{(m)}&{p_{N2}}^{(m)}&...&{p_{NN}}^{(m)} \end{matrix}\right]}→ {\left[\begin{matrix} \pi_1&\pi_2&...&\pi_N\\ \quad\\ \pi_1&\pi_2&...&\pi_N\\ \quad\\ ...&...&...&...\\ \quad\\ \pi_1&\pi_2&...&\pi_N \end{matrix}\right]} Pm=p11(m)p21(m)...pN1(m)p12(m)p22(m)...pN2(m)............p1N(m)p2N(m)...pNN(m)π1π1...π1π2π2...π2............πNπN...πN
可以证明,此时
v = lim ⁡ k → ∞ V k k = lim ⁡ k → ∞ ( E + P + P 2 + . . . + P k − 1 ) r k = lim ⁡ k → ∞ P k r = [ π 1 π 2 . . . π N π 1 π 2 . . . π N . . . . . . . . . . . . π 1 π 2 . . . π N ] [ r ( 1 ) r ( 2 ) . . . r ( N ) ] = [ ∑ j = 1 N π j r ( j ) ∑ j = 1 N π j r ( j ) . . . ∑ j = 1 N π j r ( j ) ] \mathbf{v}=\lim_{k→∞}\frac{\mathbf{V}_k}{k}=\lim_{k→∞}\frac{(\mathbf{E}+\mathbf{P}+\mathbf{P}^2+...+\mathbf{P}^{k-1})\mathbf{r}}{k}=\lim_{k→∞}\mathbf{P}^k\mathbf{r}\\ \quad\\={\left[\begin{matrix} \pi_1&\pi_2&...&\pi_N\\ \quad\\ \pi_1&\pi_2&...&\pi_N\\ \quad\\ ...&...&...&...\\ \quad\\ \pi_1&\pi_2&...&\pi_N \end{matrix}\right]} {\left[\begin{matrix} r(1)\\ \quad\\ r(2)\\ \quad\\ ...\\ \quad\\ r(N) \end{matrix}\right]}={\left[\begin{matrix} \sum_{j=1}^{N}\pi_jr(j)\\ \quad\\ \sum_{j=1}^{N}\pi_jr(j)\\ \quad\\ ...\\ \quad\\ \sum_{j=1}^{N}\pi_jr(j) \end{matrix}\right]} v=klimkVk=klimk(E+P+P2+...+Pk1)r=klimPkr=π1π1...π1π2π2...π2............πNπN...πNr(1)r(2)...r(N)=j=1Nπjr(j)j=1Nπjr(j)...j=1Nπjr(j)
无限时段单位时间平均收益与初始状态无关,均为
v ( i ) = ∑ j = 1 N π j r ( j ) v(i)=\sum_{j=1}^{N}\pi_jr(j) v(i)=j=1Nπjr(j)

有限时段期望总收益例题:
某公司生产的电子产品,每月市场状况有畅销和滞销两种。1代表畅销,2代表滞销。如产品畅销获利50万元;滞销将亏损30万元。调查统计了过去24个月的销售纪录如表所示:
\quad 过去24个月的销售纪录

月份123456789101112
销售状态畅销畅销滞销畅销滞销滞销畅销畅销滞销畅销畅销滞销
月份131415161718192021222324
销售状态畅销畅销滞销滞销畅销畅销滞销畅销畅销滞销畅销畅销

问题:如当前月份该产品畅销,以当前月份记为第一个月,求第四步状态转移前(即前四个月)所获得得期望总利润为多少。
解:
用1表示畅销,2表示滞销。已知
r = [ r ( 1 ) r ( 2 ) ] = [ 50 − 30 ] \mathbf{r}={\left[\begin{matrix} r(1)\\ \quad\\ r(2)\\ \end{matrix}\right]}={\left[\begin{matrix} 50\\ \quad\\ -30\\ \end{matrix}\right]} r=r(1)r(2)=5030
i = 1 i=1 i=1,有三种形式的公式:
v 4 ( 1 ) = r ( 1 ) + ∑ n = 1 4 − 1 [ p 11 ( n ) r ( 1 ) + p 12 ( n ) r ( 2 ) ] V 4 = ( ∑ n = 0 4 − 1 P n ) r = ( E + P + P 2 + P 3 ) r v 4 ( i ) = r ( i ) + ∑ j = 1 2 p i j v 3 ( j ) , i = 1 , 2 v 0 ( i ) = 0 , i = 1 , 2 , . . . , N v_4(1)=r(1)+\sum_{n=1}^{4-1}[p_{11}^{(n)}r(1)+p_{12}^{(n)}r(2)]\\ \quad\\ \mathbf{V}_4=(\sum_{n=0}^{4-1}\mathbf{P}^n)r=(\mathbf{E}+\mathbf{P}+\mathbf{P}^2+\mathbf{P}^3)\mathbf{r}\\ \quad\\ v_4(i)=r(i)+\sum_{j=1}^2{p_{ij}v_3(j),i=1,2}\\ \quad\\ v_0(i)=0,i=1,2,...,N v4(1)=r(1)+n=141[p11(n)r(1)+p12(n)r(2)]V4=(n=041Pn)r=(E+P+P2+P3)rv4(i)=r(i)+j=12pijv3(j),i=1,2v0(i)=0,i=1,2,...,N
求出状态转移概率矩阵 P \mathbf{P} P
估计状态转移矩阵 P \mathbf{P} P:以统计频率估计连续畅销的概率。 p 11 = 7 15 − 1 = 50 % p_{11}=\frac{7}{15-1}=50\% p11=1517=50%
分子数7是表中连续出现畅销的次数,分母中的15是表中出现畅销的次数,因为第24个月是畅销,无后续纪录,故减1。
p 12 = 7 15 − 1 = 50 % , p 21 = 7 9 = 78 % , p 22 = 2 9 ≈ 22 % P = [ p 11 p 12 p 21 p 22 ] = [ 0.5 0.5 0.78 0.22 ] r = [ r ( 1 ) r ( 2 ) ] = [ 50 − 30 ] , P = [ 0.5 0.5 0.78 0.22 ] V 4 = ( ∑ n = 0 4 − 1 P n ) r = ( E + P + P 2 + P 3 ) r V 4 = [ 1.875 0.875 1.86295 0.27905 ] [ 50 − 30 ] = [ 67.5 54.776 ] p_{12}=\frac{7}{15-1}=50\%,p_{21}=\frac{7}{9}=78\%,p_{22}=\frac{2}{9}≈22\%\\ \quad\\ \mathbf{P}={\left[\begin{matrix} p_{11}&p_{12}\\ \quad\\ p_{21}&p_{22}\\ \end{matrix}\right]}={\left[\begin{matrix} 0.5&0.5\\ \quad\\ 0.78&0.22\\ \end{matrix}\right]}\\ \quad\\ \mathbf{r}={\left[\begin{matrix} r(1)\\ \quad\\ r(2)\\ \end{matrix}\right]}={\left[\begin{matrix} 50\\ \quad\\ -30\\ \end{matrix}\right]},\mathbf{P}={\left[\begin{matrix} 0.5&0.5\\ \quad\\ 0.78&0.22\\ \end{matrix}\right]}\\ \quad\\ \mathbf{V}_4=(\sum_{n=0}^{4-1}\mathbf{P}^n)r=(\mathbf{E}+\mathbf{P}+\mathbf{P}^2+\mathbf{P}^3)\mathbf{r}\\ \quad\\ \mathbf{V}_4={\left[\begin{matrix} 1.875&0.875\\ \quad\\ 1.86295&0.27905\\ \end{matrix}\right]}{\left[\begin{matrix} 50\\ \quad\\ -30\\ \end{matrix}\right]}={\left[\begin{matrix} 67.5\\ \quad\\ 54.776\\ \end{matrix}\right]} p12=1517=50%p21=97=78%p22=9222%P=p11p21p12p22=0.50.780.50.22r=r(1)r(2)=5030P=0.50.780.50.22V4=(n=041Pn)r=(E+P+P2+P3)rV4=1.8751.862950.8750.279055030=67.554.776
结果为:如当前月份该产品畅销,前四个月所获得的期望总利润为67.5万元。

补充:齐次马氏链的定义:若马氏链 { X ( n ) , n ≥ 0 } \{X(n),n≥0\} {X(n),n0}的一步转移概率与起始时刻无关,即对任意 m m m
p i j ( 1 ) ( m ) = P { X ( m + 1 ) = j ∣ X ( m ) = i } = p i j ( 1 ) = p i j p_{ij}^{(1)}(m)=P\{X(m+1)=j|X(m)=i\}=p_{ij}^{(1)}=p_{ij} pij(1)