机器学习:隐马尔可夫模型——预测算法

最新推荐文章于 2024-07-15 17:08:02 发布

无聊的人生事无聊

最新推荐文章于 2024-07-15 17:08:02 发布

阅读量1.6k

点赞数

分类专栏：信息科学文章标签：机器学习

本文链接：https://blog.csdn.net/Wangpeiyi9979/article/details/97304144

版权

信息科学专栏收录该内容

159 篇文章 1 订阅

订阅专栏

问答总结

近似算法的思想是什么，方法是怎样的？
维秘特算法的思想是什么，方法是怎样的？

文章目录

一、目标
二、近似算法
- 1、思想
- 2、方法
三、维比特算法
- 1、思想
- 2、方法

一、目标

前文说过，预测问题可以描述为:

已知模型 $\lambda=(A,B, \pi)$ 和观测序列 $O={o_1,o_2,..., o_T}$ .求最可能对应的不可观测状态序列 $I=\{i_1, i_2, ..., i_T\}$ . 即: $I^* = arg \max_{I}P(I|O,\lambda)$

二、近似算法

1、思想

在每个时刻 $t$ 选择该时刻最可能出现的状态 $i_t^*$ , 从而得到状态序列 $I^*=(i_1^*, i_2^*, ..., i_T^*)$ .

2、方法

回想概率计算方法，我们得到了一个很重要的概率值:
$\gamma_t(i)=P(i_t=q_i|O, \lambda)=\frac{\alpha_t(i)\beta_t(i)}{\sum_{j=1}^N\alpha_t(j)\beta_t(j)}$
其含义为: 给定模型 $\lambda$ 和观测 $O$ , 在时刻 $t$ 处于状态 $q_i$ 的概率。

因此每个时刻 $t$ 最可能的状态 $i_t^*$ 为:

$i_t^*=arg \max_{1 \le i \le N}[\gamma_t(i)], t=1,2,...,T$

这样，我们就可以得到状态序列 $I^*=(i_1^*, i_2^*, ..., i_T^*)$ .

三、维比特算法

1、思想

预测问题的目标是 $I^* = arg \max_{I}P(I|O,\lambda)$
由于状态序列 $O$ 和模型 $\lambda$ 已知，因此 $P(O|\lambda)$ 为一个常数，所以有：

$I^* = arg \max_{I}P(I|O,\lambda) = arg \max_{I}\frac{P(I, O|\lambda)}{P(O|\lambda)} = arg \max_IP(I,O|\lambda)$

因此在预测问题中，我们可以转而对联合概率建模。找到联合概率最大的一个状态序列。

2、方法

将T步，每步可选状态数为N的状态序列的所有可能描述为一个图，其中图的一条路径等价于一个状态序列。 下图为序列长度： $T = 3$ ，状态数目： $N = 3$ 的所有路径。其中一条路径是对应一个状态序列，也对应着一个联合概率 $P(o_1,o_2, o_3, i_1, i_2, i_3 | \lambda)$ 。其中 $i_* \in \{A, B, C\}$ , $o_*$ 为已知的观测， $\lambda$ 为已知模型。
在这里插入图片描述

最简单的，我们可以通过暴力搜索，求出每一条路径对于的概率，然后选取概率最大的那条路径，即为所求状态序列。但是复杂度太高，为 $O(N^T)$

仔细观察，这对应着一个有向无环图(DAG)，其最大联合概率路径很容易可以使用动态规划方法求出。

因此来到动态规划问题求解步骤:

(1) 定义状态:
- 在时刻 $t$ 状态为 $i$ 的最大联合概率: $\delta_t(i) = \max_{i_1, i_2, ...\, i_{t-1}}P(i_t=i, i_{t-1}, ..., i_1, o_t, ..., o_1|\lambda)$
- 在时刻 $t$ 状态为 $i$ 的最大联合概率路径的前一个节点，即时刻 $t - 1$ 的结点(相当于路径回溯的指针): $\Psi_t(i)=arg \max_{1 \le j \le N}[\delta_{t-1}(j)a_{ji}]$
(2) 目标状态:
- 路径最大联合概率： $P^* = \max_{1 \le i\le N}\delta_T(i)$
- 所求路径最后一个状态节点: $i^*_T= arg \max_{1 \le i \le N}[\delta_T(i)]$
(3) 状态转移:
- 状态转移图:
- 状态转移方程:
  $\delta_t(i)= \max_{1 \le j \le N}[\delta_{t-1}(j)a_{ji}]b_i(o_t), i=1,2,...,N$
  $\Psi_t(i) = arg \max_{1 \le j \le N}[\delta_{t-1}(j)a_{ji}]b_i(o_t), i=1,2,...,N$
(4) 初始化:
$\delta_1(i)=\pi_ib_i(o_1), i = 1,2,...,N$
$\Psi_1(i)=0, i=1,2,...,N$
(5) 回溯

由于所求不只是一个概率，而是一条路径，因此最后回溯: $i_t^* = \Psi_{t+1}(i_{t+1}^*), t=T-1,T-2,...,1$

无聊的人生事无聊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习:隐马尔可夫模型——预测算法

问答总结近似算法的思想是什么，方法是怎样的？维秘特算法的思想是什么，方法是怎样的？文章目录一、目标二、近似算法1、思想2、方法三、维比特算法1、思想2、方法一、目标前文说过，预测问题可以描述为:已知模型λ=(A,B,π)\lambda=(A,B, \pi)λ=(A,B,π)和观测序列O=o1,o2,...,oTO={o_1,o_2,..., o_T}O=o1,o2,...,o...
复制链接

扫一扫

专栏目录