马尔可夫链 | 小白都能看懂的马尔可夫链详解

e1ab4fc7c0438896f6405fc7242e6811.png

来源:机器学习算法那些事 CSDN博主
本文约1700字,建议阅读5分钟
一文带你看懂马尔科夫链。

1.什么是马尔可夫链

在机器学习算法中,马尔可夫链(Markov chain)是个很重要的概念。马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain),因俄国数学家安德烈·马尔可夫(俄语:Андрей Андреевич Марков)得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。马尔科夫链作为实际过程的统计模型具有许多应用。

在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。


2.一个经典的马尔科夫链实例

用一句话来概括马尔科夫链的话,那就是某一时刻状态转移的概率只依赖于它的前一个状态。

举个简单的例子,假如每天的天气是一个状态的话,那个今天是不是晴天只依赖于昨天的天气,而和前天的天气没有任何关系。

这么说可能有些不严谨,但是这样做可以大大简化模型的复杂度,因此马尔科夫链在很多时间序列模型中得到广泛的应用,比如循环神经网络RNN,隐式马尔科夫模型HMM等。

假设状态序列为

c013982e53f65fdf1807b7009362db1d.png

由马尔科夫链定义可知,

时刻Xt+1 的状态只与Xt 有关,用数学公式来描述就是:

bbb8b778841841e95106e6f313249ed3.png

既然某一时刻状态转移的概率只依赖前一个状态,那么只要求出系统中任意两个状态之间的转移概率,这个马尔科夫链的模型就定了。看一个具体的例子。

ecf565c367bc02a8cfdf36a143a3c457.png

这个马尔科夫链是表示股市模型的,共有三种状态:牛市(Bull market), 熊市(Bear market)和横盘(Stagnant market)。

每一个状态都以一定的概率转化到下一个状态。比如,牛市以0.025的概率转化到横盘的状态。这个状态概率转化图可以以矩阵的形式表示。如果我们定义矩阵阵P某一位置P(i, j)的值为P(j|i),即从状态i变为状态j的概率。另外定义牛市、熊市、横盘的状态分别为0、1、2,这样我们得到了马尔科夫链模型的状态转移矩阵为:

cac7b83a52d1969b768491fa46759024.png

当这个状态转移矩阵P确定以后,整个股市模型就已经确定!

3.状态转移矩阵

从上面的例子不难看出来,整个马尔可夫链模型的核心是状态转移矩阵P。那这个矩阵P有一些什么有意思的地方呢?接下来再看一下。

以股市模型为例,假设初始状态为t0=[0.1,0.2,0.7] ,然后算之后的状态。

07b52c475391010e22baa815c5563230.png

最终输出结果为

bd3ccafef0dcd6242b513268fa80c0ed.png

从第18次开始,状态就开始收敛至[0.624,0.312,0.0625] 。最终数字上略有不同,只是计算机浮点数运算造成的罢了。

如果我们换一个初始状态t0 ,比如[0.2,0.3.0.5] 继续运行上面的代码,只是将init_array变一下,最后结果为:

2126eb86d3d0373a16e30dada2f89b5c.png

到第18次的时候,

又收敛到了[0.624,0.312,0.0625] 

这个转移矩阵就厉害了。不管我们的初始状态是什么样子的,只要状态转移矩阵不发生变化,当n→∞ 时,最终状态始终会收敛到一个固定值。

在矩阵分析,自动控制原理等过程中,经常会提到矩阵的幂次方的性质。我们也看看这个状态转移矩阵P的幂次方有什么有意思的地方?直接上代码。

b3882bb9c6be3a18ba135e5172314ef9.png

代码运行结果为

ce722945a1562c98ba75ca6b75de5944.pngb55dfe1bcc32c35838b6bc196f5eb728.png46c3f33cfa0beb9a5136cb384e2f6736.png

从第20次开始,结果开始收敛,并且每一行都为[0.625,0.312,0.0625] 。

4.马尔可夫链细致平稳条件

首先,马尔科夫链要能收敛,需要满足以下条件:

1.可能的状态数是有限的。

2.状态间的转移概率需要固定不变。

3.从任意状态能够转变到任意状态。

4.不能是简单的循环,例如全是从x到y再从y到x。

以上是马尔可夫链收敛的必要条件。

假设有一个概率的单纯形向量

a0d42f9ac92ef478c040d6f0df33358e.png

有一个概率转移矩阵P PP,例如我们前面的例子:

2b2c72eb055b9ba5026f5ae3a1dd86ea.png

其中,v0 每个元素的取值范围为[0,1],并且所有元素的和为1。而P 的每一行也是个概率单纯形向量。

由前面的例子我们不难看出,当v0 与P 的n次幂相乘以后,发现得到的向量都会收敛到一个稳定值,而且此稳定值与初始向量v0 无关!

那么所有的转移矩阵P 都有这种现象嘛?或者说满足什么样的条件的转移矩阵P会有这种现象?

细致平衡条件(Detailed Balance Condition):给定一个马尔科夫链,分布π和概率转移矩阵P,如果下面等式成立:

5a8bea191353cbbac0181c752dcc2d30.png

则此马尔科夫链具有一个平稳分布(Stationary Distribution)。

证明过程比较简单:

137d1c7cad03ec925fb33f1cf7cae382.png

上式取j→∞ ,就可以得到矩阵表达式:

40826e63cb12a5d36700c6ea9fe7fe82.png

5.马尔可夫链收敛性质

如果一个非周期的马尔可夫链收敛,有状态转移矩阵P,并且任何两个状态都是连通的,那么

f0a388eaac8c3a0f891139dc3cbd4c60.png

π是方程πP=π 的唯一非负解,其中:

feefed393aa69205fab8e46e1ebe886c.png

编辑:于腾凯

校对:林亦霖

e588b62ef17e95e7efecdabc60adf424.png

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Bianchi马尔科夫链是一种用于描述在无线通信信道中发送数据包的时空中复杂的相关性的数学模型。它由意大利数学家G. Bianchi在1999年提出,并成功应用于用于分析和设计无线通信协议的研究中。 Bianchi马尔科夫链的基本思想是将时空中的通信环境建模为一个马尔科夫链马尔科夫链是一种具有无记忆性的随机过程,即其未来状态只依赖于当前状态,而与过去状态无关。在Bianchi马尔科夫链中,每个时刻的状态代表通信信道中的某个物理随机属性,例如信噪比、干扰等。通过建立状态转移概率矩阵,可以表示在不同状态之间的转移概率,从而描述整个通信过程的动态演化过程。 Bianchi马尔科夫链的应用主要集中在无线局域网(WLAN)和移动无线通信系统(如LTE、5G)等领域。通过分析和建模信道中的相关性,可以更好地理解和优化无线通信协议的性能。例如,在WLAN中,可以通过对Bianchi马尔科夫链的分析,提高通信信道的利用率和传输吞吐量,减少数据包的丢失率和传输延迟。在移动无线通信系统中,可以通过Bianchi马尔科夫链来研究和优化切换策略、功率控制、资源分配等关键问题,提升系统的容量和覆盖范围。 总之,Bianchi马尔科夫链提供了一种可靠的数学工具,用于建模和分析无线通信信道中的时空相关性。它在无线通信协议设计和性能优化中发挥着重要的作用,为提高无线通信的效率和可靠性提供了理论支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值