隐马尔可夫模型【维特比算法】

格兰芬多_未名

已于 2024-03-17 13:55:06 修改

阅读量1.5k

点赞数 22

分类专栏：机器学习文章标签：算法人工智能机器学习

于 2024-01-04 19:07:54 首次发布

本文链接：https://blog.csdn.net/v20000727/article/details/135393911

版权

机器学习专栏收录该内容

16 篇文章 6 订阅

订阅专栏

本文详细介绍了维特比算法，一种用于寻找最有可能产生观测事件序列的隐含状态序列的动态规划方法，包括其核心思想、递推公式以及在机器学习中的应用实例。

摘要由CSDN通过智能技术生成

章节目录

机器学习系列笔记，主要参考李航的《机器学习方法》，见参考资料。
第一章机器学习简介
 第二章感知机
 第三章支持向量机
 第四章朴素贝叶斯分类器
 第五章 Logistic回归
 第六章线性回归和岭回归
 第七章多层感知机与反向传播【Python实例】
第八章主成分分析【PCA降维】
第九章隐马尔可夫模型
 第十章奇异值分解

维特比算法是一种动态规划算法用于寻找最有可能产生观测事件序列的隐含状态序列.

一、维特比算法核心思想

viterbi维特比算法解决的是篱笆型的图的最短路径问题，图的节点按列组织，每列的节点数量可以不一样，每一列的节点只能和相邻列的节点相连，不能跨列相连.

过程非常简单：

为了找出S到E之间的最短路径，我们先从S开始从左到右一列一列地来看。
首先起点是S，从S到A列的路径有三种可能：S-A1、S-A2、S-A3，如下图：

S-A1、S-A2、S-A3中的哪一段都有可能是全局最短路径的备选项，我们继续往右看，到了B列。按B列的B1、B2、B3逐个分析：

如上图，经过B1的所有路径只有3条：

S-A1-B1
S-A2-B1
S-A3-B1

以上这三条路径，各节点距离加起来对比一下，我们就可以知道其中哪一条是最短的。假设S-A3-B1是最短的，那么我们就知道了经过B1的所有路径当中S-A3-B1是最短的，其它两条路径路径S-A1-B1和S-A2-B1都比S-A3-B1长，绝对不是目标答案，可以删掉了，删掉了不可能是答案的路径，就是viterbi算法（维特比算法）的重点，因为后面我们再也不用考虑这些被删掉的路径了，现在经过B1的所有路径只剩一条路径了，如下图：

以此类推后面的结点……

二、viterbi算法

viterbi算法的核心主要是：

定义时刻t每个状态 $s_i$ 的路径概率 $\delta_t(i)$ .
$\delta_t(i)$ 的递推公式.
回溯每个时刻的最优状态.

给定 $\lambda=(A,B,\pi)$ 和长度为 $T$ 的观测序列

$\mathbf{0}=\{O_1,O_2,\cdots,O_T\},$

求与观测序列O最匹配的状态序列

$\mathbf{X}=\{X_1,X_2,\cdots,X_T\}.$

相当于找到使得 $P(X|0,\lambda)$ 最大的状态序列 $X^*$ , 即

$\mathbf{X}^*=\underset{\mathbf{X}}{\operatorname*{argmax}}P(\mathbf{X}|\mathbf{O},\lambda),$ 所求的最优状态序列$ X^*$也可以定义为
$\mathbf{X}^*=\underset{\mathbf{X}}{\operatorname*{argmax}}P(\mathbf{X},\mathbf{O}|\lambda).$ 考虑时刻 $t\leq N$ 状态为 $s_i\quad(1\leq i\leq N)$ 的所有单个路径
$(X_1,X_2,\cdots,X_{t-1},X_t=s_i).$ 所对应的概率的最大值为（也就是每个时刻每个状态对应观察序列的概率，可以递推）：

$\delta_t(i)=\max\limits_{X_1,X_2,...,X_{t-1}}P(X_t=s_i,X_1,X_2,\cdots,X_{t-1},O_1,O_2,\cdots,O_t),$
显然对最优路径 $X^*$ 而言，
$P(X^*,O|\lambda)=\max\limits_{1\leq i\leq N}\delta_T(i),$ 而且
$X_T^* = \arg\max\limits_{s_i,1\leq i\leq N} \delta_T( i) .$
截屏2024-01-04 18.37.47

结合第一部分的动态规划思想，路径最大概率 $\delta_t(i)(2\leq t\leq T)$ 的递推公式如下：
$\delta_t(i)=\max_{1\leq j\leq N}[\delta_{t-1}(j)a_{ji}]b_i(O_t),\mathrm{~}i=1,2,\cdots,N.$ 由此我们可以递推计算出 $\delta_T(i),\quad i=1,2,\cdots,N.$ 完整算法框架如下：