23、隐马尔可夫模型(HMM)上

healed萌

已于 2023-11-27 15:17:22 修改

阅读量910

点赞数 23

分类专栏：机器学习文章标签：算法

于 2023-11-27 12:17:56 首次发布

本文链接：https://blog.csdn.net/m0_56642803/article/details/134586147

版权

本文介绍了隐马尔可夫模型的基本概念，详细介绍了模型的定义、基本假设、观测序列的生成过程、三个基本问题，并进行详细介绍了概率计算（包括前向计算、后向计算、以及利用前后向算法计算某些概率与期望值）

摘要由CSDN通过智能技术生成

隐马尔可夫模型 (hidden Markov model. HMM) 是可用于标注问题的统计学习模型，描述由隐藏的马尔可夫链随机生成观测序列的过程，属于生成模型。

1 隐马尔可夫模型的基本概念

1.1 隐马尔可夫模型的定义

定义： 隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测从而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列，称为状态序列(state sequence ) ；每个状态生成一个观测，而由此产生的观测的随机序列，称为观测序列(observation sequence )。序列的每一个位直又可以看作是一个时刻。

隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔可夫模型的形式定义如下：

设 $Q$ 是所有可能状态的集合；每个状态可以产生各种观测，设 $V$ 是所有可能观测的集合。 $Q, V$ 的定义如下： $Q=\{q_1,q_2,\dots, q_N\},\;\;V=\{v_1,v_2,\dots,v_M\}$ ，其中， $N$ 是可能的状态数， $M$ 是可能的观测数。注意，这里的状态和观测不一定是数字，也可以是各种具体的对象。
$I$ 为长度为 $T$ 的模型状态序列，定义 $O$ 为对应的观测序列。 $I=(i_1,i_2,\dots,i_T),\;\;O=(o_1,o_2,\dots,o_T)$

隐马尔可夫模型由以下三个分布决定，因此可以用一个三元符号表示： $\lambda = (A,B,\pi)$

$\pi$ 是初始状态概率分布，时间 $t = 1$ 处于 $q_i$ 的概率定义为：
$\begin{aligned}&\pi = [\pi_1,\pi_2,\dots,\pi_N]^T\\ &\pi_i=P(i_1=q_i),\;\;i = 1,2,\dots,N \end{aligned}$
$A$ 是状态转移概率分布，时刻t处于状态 $q_i$ 的条件下在下一时刻 $t + 1$ 转移到状态 $q_j$ 的概率。
$\begin{aligned} &A = [a_{ij}]_{N\times N}\\& a_{ij} = P(i_{t+1}=q_j|i_t=q_i),\ \ \ i,j = 1,2,\dots ,N\end{aligned}$
$B$ 是观测概率分布，在时刻 $t$ 处于状态 $q_j$ 的条件下生成观测 $v_k$ 的概率。
$\begin{aligned} &B = [b_{j}(k)]_{N\times M}\\ & b_{j}(k) = P(o_t=v_k|i_t=q_j),\ \ k=1,2,\dots,M,j=1,2,\dots,N \end{aligned}$

状态转移概率矩阵 $A$ 与初始状态概率向量 $\pi$ 确定了隐藏的马尔可夫链，生成不可观测的状态序列。观测概率矩阵 $B$ 确定了如何从状态生成观测，与状态序列综合确定了如何产生观测序列。

1.2 HMM基本假设

从定义可知，HMM做了两个基本假设：

齐次马尔可夫性假设。任意时刻 $t$ 的状态只依赖于前一时刻的状态，与其它时刻的状态及观测无关： $P(i_t|i_{t-1},o_{t-1},\dots,i_1,o_1) = P(i_t|i_{t-1})$

注意，以上条件概率中将除 $i_{t-1}$ 以外的条件去掉，是因为 $i_{t-1}$ 已知，并且没有之后时刻的状态或观测作为条件。如果 $i_{t-1}$ 未知，则可以去掉 $t$ 时刻之前的条件中，离 $t$ 最近的 $t^-$ 之前的状态和观测（包含 $t^-$ 时刻的观测）。如： $P(i_t|i_{t-2},o_{t-2},i_{t-3},i_{t-4}) = P(i_t|i_{t-2})$

另外，假如有之后时刻的状态，计算的概率就是后验概率了，那么之后时刻的状态作为条件来说也不能去掉。但是可以去掉 $t$ 时刻之后的条件中，离 $t$ 最近的 $t^+$ 之后的状态和观测（包含 $t^+$ 时刻的观测）如： $P(i_t|i_{t-2},i_{t-1},o_{t-1},o_{t+1},i_{t+2},o_{t+2},o_{t+3}) = P(i_t|i_{t-1},o_{t+1},i_{t+2})$

总之，就是近的状态已知，远的状态对于计算条件概率来说就没有意义了。
观测独立性假设。任意时刻的观测只依赖于此刻的状态，与其它无关： $P(o_t|i_t,o_{t-1},\dots,i_1,o_1) = P(o_t|i_t)$

这个条件概率和上面也一样，也是近的状态已知，远处的状态作为条件就无意义。

在这里插入图片描述

1.3 观测序列的生成过程

根据隐马尔可夫模型定义，可以将一个长度为 $T$ 的观测序列 $O=(o_1,o_2,\dots,o_T)$ 的生成过程描述如下：

输入：隐马尔可夫模型 $\lambda = (A,B,\pi)$ ，观测序列长度 $T$ ；
输出：观测序列 $O=(o_1,o_2,\dots,o_T)$ 。
(1) 按照初始状态分布 $\pi$ 产生状态 $i_1$

最低0.47元/天解锁文章

healed萌

关注

23
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
23、隐马尔可夫模型(HMM)上

本文介绍了隐马尔可夫模型的基本概念，详细介绍了模型的定义、基本假设、观测序列的生成过程、三个基本问题，并进行详细介绍了概率计算（包括前向计算、后向计算、以及利用前后向算法计算某些概率与期望值）
复制链接

扫一扫