隐马尔可夫模型之预测算法

Andy_shenzl

已于 2022-12-31 18:21:49 修改

阅读量3.7k

点赞数 6

分类专栏：机器学习

于 2020-08-06 17:39:13 首次发布

本文链接：https://blog.csdn.net/Andy_shenzl/article/details/107840872

版权

机器学习专栏收录该内容

47 篇文章 13 订阅

订阅专栏

隐马尔可夫模型之HMM基础
 隐马尔可夫模型之评估观察序列概率
 隐马尔可夫模型之学习算法
 隐马尔可夫模型之预测算法
 隐马尔可夫模型之python实战

预测算法主要有两种：

近似算法
维特比算法

近似算法

近似算法的思想是，在每个时刻t选择在该时刻最有可能出现的状态 $i_t^*$ ,从而得到一个状态序列 $I^*=(i_1^*,i_2^*,…,i_T^*)$ ,将它作为预测的结果。

给定隐马尔可夫模型 $\lambda$ 和观测序列O，在时刻t处于状态 $q_i$ 的概率 $\gamma_t(i)$ 是
$\gamma_t(i)=\frac{\alpha_t(i)\beta_t(i)}{P(O|\lambda)}=\frac{\alpha_t(i)\beta_t(i)}{\sum_{j=1}^N\alpha_t(j)\beta_t(j)}$

在每一时刻t最有可能出现的状态 $i_t^*$ 是：
$i_t^*=arg\,\,\underbrace{max}_{1\leq i\leq N}[\gamma_t(i)],t=1,2,……,T$

从而得到状态序列 $I^*=(i_1^*,i_2^*,…,i_T^*)$

维特比算法

维特比算法实际是用动态规划解马尔可夫模型预测的问题，即用动态规划求概率最大路径（最优路径）。这时一条路径对应着一个状态序列。

根据动态规划原理，最优路径具有这样的性质：如果最优路径在时刻t通过结点 $i_t^*$ ，那么这一路径从结点 $i_t^*$ 到终点 $i_T^*$ 的部分路径，对于从 $i_t^*$ 到 $i_T^*$ 的所有可能部分路径来说，必须是最优的。因为假如不这样，那么从 $i_t^*$ 到 $i_T^*$ 就有一条更好的部分路径存在，如果把他和从 $i_t^*$ 到 $i_T^*$ 的部分路径连接起来，就会形成一条比原来更优的路径，那么这是矛盾的。

依据这一原理，我们只需要从时刻t=1开始，递推的计算时刻t状态为i的各条部分路径的最大概率，直至得到时刻t=T状态为i的各条路径的最大概率。时刻t=T的最大概率即为最优路径的概率 $P^*$ ,最优路径的终结点 $i_T^*$ 也同时得到。之后，为了找出最优路径的各个节点，从终结点 $i_T^*$ 开始，由后向前逐步求得结点 $i_{T-1}^*,……,i_1^*$ ，这就是维特比算法。

首先导入两个变量 $\delta$ 和 $\Psi$ 。定义在时刻t状态为i的所有单个路径 $i_1,i_2,……,i_t)$ 中概率最大值为
$\delta_t(i)=\underbrace{max}_{i_1,i_2,……,i_{t-1}}P(i_t=i,i_{t-1},…,i_1,o_t,…,o_1|\lambda)，i=1,2,…,N$

由上定义可得变量 $\delta$ 的递推公式：
$\delta_{t+1}(i)=\underbrace{max}_{i_1,i_2,……,i_{t}}P(i_t=i,i_{t},…,i_1,o_{t+1},…,o_1|\lambda)，i=1,2,…,N;t=1,2,…,T-1$

定义在时刻t状态为i的所有单个路径 $i_1,i_2,……,i_{t-1},i)$ 中概率最大的路径的第t-1个结点为
$\Psi_t(i)=arg\,\,\underbrace{max}_{1\leq i\leq N}[\delta_{t-1}(j)a_{ij}]，i=1,2,…,N$

算法

输入：模型 $\lambda=(A,B,\pi)$ 和观测 $O=(o_1,o_2,……,o_T)$ ；
输出：最优路径 $I^*=(i_1^*,i_2^*,…,i_T^*)$

初始化
$\delta_1(i)=\pi_ib_i(o_1)，i=1,2,…,N$
$\Psi_t(i)=0，i=1,2,…,N$
递推。对 $t = 2 ， 3, \dots, T$
$\delta_t(i)=\,\,\underbrace{max}_{1\leq i\leq N}[\delta_{t-1}(j)a_{ij}]b_i(o_t)，i=1,2,…,N$
$\Psi_t(i)=arg\,\,\underbrace{max}_{1\leq i\leq N}[\delta_{t-1}(j)a_{ij}]，i=1,2,…,N$
终止
$P^*=\underbrace{max}_{1\leq i\leq N}\delta_{T}(i)$
$i_T^*=arg\,\,\underbrace{max}_{1\leq i\leq N}\delta_{T}(i)$
最优路径回溯。对 $t = T - 1, T - 2, \dots, 1$
$i_t^*=\Psi_{t+1}(i_{t+1}^*)$
求得最优路径 $I^*=(i_1^*,i_2^*,…,i_T^*)$

实例

使用前面的例子：
初始状态分布为：
$\Pi=(0.2,0.4,0.4)^T$

状态转移概率分布矩阵为：

$\begin{pmatrix} 0.5 & 0.2 & 0.3 \\ 0.3 & 0.5 & 0.2 \\ 0.2 & 0.3 & 0.5 \\ \end{pmatrix}$

观测状态概率矩阵为：

$\begin{pmatrix} 0.5 & 0.5 \\ 0.4 & 0.6 \\ 0.7 & 0.3 \\ \end{pmatrix}$

已知观测序列 $O=({\text{红，白，红}})$ ，试求最优状态序列，即最优路径 $I^*=(i_1^*,i_2^*,i_3^*)$

解：

初始化：
在t=1时，对每一个状态i, $i = 1, 2, 3$ ，求状态为i观测我为 $o_1$ 为红的概率，记此概率为 $\delta_1(i)$ ,则

$\delta_1(i)=\pi_ib_i(o_1),i=1,2,3$

带入数据
$\delta_1(1)=\pi_1b_1(o_1)=0.2×0.5=0.1$
$\delta_1(2)=\pi_2b_2(o_1)=0.4×0.4=0.16$
$\delta_1(3)=\pi_3b_3(o_1)=0.4×0.7=0.28$

$\Psi_1(1)=\Psi_1(2)=\Psi_1(3)=0$

递推：
t=2时，对于每个状态 $i, i = 1, 2, 3$ ,求在t=1时状态为j观测为红并在t=2时刻状态为i观测 $o_2$ 为白的路径的最大概率，记此最大概率为 $\delta_2(i)$ ,则

$\delta_t(i)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{ji}]b_i(o_2)$

带入实际数据

$\delta_2(1)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j1}]b_1(o_2)=\underbrace{max}_{1\leq i\leq 3}[0.1×0.5,0.16×0.3,0.28×0.2]×0.5=0.028$

$\Psi_2(1)=3$

$\delta_2(2)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j2}]b_2(o_2)=\underbrace{max}_{1\leq i\leq 3}[0.1×0.2,0.16×0.5,0.28×0.3]×0.6=0.0504$

$\Psi_2(2)=3$

$\delta_2(3)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j3}]b_3(o_2)=\underbrace{max}_{1\leq i\leq 3}[0.1×0.3,0.16×0.2,0.28×0.5]×0.3=0.042$

$\Psi_2(3)=3$

同理t=3时

$\delta_3(1)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j1}]b_1(o_3)=\underbrace{max}_{1\leq i\leq 3}[0.028×0.5,0.0504×0.3,0.042×0.2]×0.5=0.00756$

$\Psi_3(1)=2$

$\delta_3(2)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j2}]b_2(o_3)=\underbrace{max}_{1\leq i\leq 3}[0.028×0.2,0.0504×0.5,0.042×0.3]×0.4=0.01008$

$\Psi_3(2)=2$

$\delta_3(3)=\,\,\underbrace{max}_{1\leq i\leq 3}[\delta_{1}(j)a_{j3}]b_3(o_3)=\underbrace{max}_{1\leq i\leq 3}[0.028×0.3,0.0504×0.2,0.042×0.5]×0.7=0.0147$