马尔可夫链

马尔可夫链(英语:Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain,缩写为DTMC),因俄国数学家安德烈·马尔可夫得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“记忆性”称作马尔可夫性质
  在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。
  随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。

1 定义

  马尔可夫链是满足马尔可夫性质的随机变量序列 X 1 , X 2 , X 3 , . . . , X_1,X_2,X_3,..., X1,X2,X3,...,即给出当前状态,将来状态和过去状态是相互独立的。从形式上看,如果两边的条件分布有定义(即如果 P ( X 1 = x 1 , . . . , X n = x n ) > 0 P(X_1=x_1,...,X_n=x_n)>0 P(X1=x1,...,Xn=xn)>0),则:
P ( X n + 1 ∣ X 1 = x 1 , X 2 = x 2 , . . . , X n = x n ) = P ( X n + 1 = x 1 ∣ X n = x n ) P(X_{n+1}|X_1=x_1,X_2=x_2,...,X_n=x_n)=P(X_{n+1}=x_1|X_n=x_n) P(Xn+1X1=x1,X2=x2,...,Xn=xn)=P(Xn+1=x1Xn=xn) X i X_i Xi的可能构成的可数集 S S S叫做该链的“状态空间” 。

2 描述

  通常用一系列有向图来描述马尔可夫链,其中图 n n n的边用从时刻 n n n的状态到时刻 n + 1 n+1 n+1的状态的概率 P ( X n + 1 = x 1 ∣ X n = x n ) P(X_{n+1}=x_1|X_n=x_n) P(Xn+1=x1Xn=xn)来标记。也可以用时刻 n n n的状态到时刻 n + 1 n+1 n+1转移矩阵表示同样的信息。但是,马氏链常常被假定为时齐的(见变种),在这种情况下,图和矩阵与 n n n无关,因此也不表现为序列。
  这些描述强调了马尔可夫链与初始分布 P ( X 1 = x 1 ) P(X_1=x_1) P(X1=x1)无关这一结构。当时齐的时候,可以认为马氏链是分配从一个顶点或状态跳变到相邻一个的概率的状态机。可以把状态概率 P ( X n = x ∣ X 1 = x 1 ) P(X_n=x|X_1=x_1) P(Xn=xX1=x1)作为仅有元素 x 1 x_1 x1的状态空间为输入的机器的统计行为分析,或作为初始分布为 P ( X 1 = y ) = [ x 1 = y ] P(X_1=y)=[x_1=y] P(X1=y)=[x1=y]

3 变种

3.1 时齐马尔可夫链(或静态马尔科夫链)

对于所有 n n n
P ( X n + 1 = x ∣ X n = y ) = P ( X n = x ∣ X n − 1 = y ) P(X_{n+1}=x|X_n=y)=P(X_n=x|X_{n-1}=y) P(Xn+1=xXn=y)=P(Xn=xXn1=y)的过程。转移概率与 n n n无关。

3.2 m m m阶马尔科夫链

记忆为 m m m的马尔可夫链,其中 m m m有限,为满足
P ( X n = x n ∣ X n − 1 = x n − 1 , X n − 2 = x n − 2 , . . . , X 1 = x 1 ) P(X_n=x_n|X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},...,X_1=x_1) P(Xn=xnXn1=xn1,Xn2=xn2,...,X1=x1)
= P ( X n = x n ∣ X n − 1 = x n − 1 , X n − 2 = x n − 2 , . . . , X n − m = x n − m ) , n > m =P(X_n=x_n|X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},...,X_{n-m}=x_{n-m}),n>m =P(Xn=xnXn1=xn1,Xn2=xn2,...,Xnm=xnm),n>m
的过程。换句话说,未来状态取决于其前m个状态。

4 瞬态演变

n n n步从状态 i i i到状态 j j j的概率为
p i j ( n ) = P ( X n = j ∣ X 0 = i ) p_{ij}^{(n)}=P(X_n=j|X_0=i) pij(n)=P(Xn=jX0=i)而单步转移是
p i j = P ( X 1 = j ∣ X 0 = i ) p_{ij}=P(X_1=j|X_0=i) pij=P(X1=jX0=i)对于一个时齐马尔科夫链来说:
p i j ( n ) = P ( X k + n = j ∣ X k = i ) p_{ij}^{(n)}=P(X_{k+n}=j|X_k=i) pij(n)=P(Xk+n=jXk=i) p i j = P ( X k + 1 = j ∣ X k = i ) p_{ij}=P(X_{k+1}=j|X_k=i) pij=P(Xk+1=jXk=i)

参考:https://zh.wikipedia.org/wiki/马尔可夫链

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值