隐马尔科夫模型 (HMM) 算法介绍及代码实现

最新推荐文章于 2024-07-29 14:15:17 发布

置顶

EdisonLeejt

最新推荐文章于 2024-07-29 14:15:17 发布

阅读量6k

点赞数 6

分类专栏：机器学习教程文章标签： HMM 隐马尔科夫维特比算法前向后向算法 Baum-Welch算法

本文链接：https://blog.csdn.net/Edisonleeee/article/details/103430450

版权

这篇博客详细介绍了隐马尔科夫模型(HMM)的定义、基本问题，包括评估观测序列概率、预测问题和模型参数学习问题。文中通过前向算法、后向算法、Viterbi算法和Baum-Welch算法的流程和代码实现，帮助读者深入理解HMM。此外，还提及了hmmlearn库的安装、使用和常见错误。

摘要由CSDN通过智能技术生成

Hidden Markov Model (隐马尔科夫模型)
定义
基本问题
前向算法
- 算法流程
- 实现代码
后向算法
- 算法流程
- 实现代码
Viterbi算法
- 算法流程
- 实现代码
Baum-Welch 算法
符号总结
hmmlearn
GitHub
参考资料

Hidden Markov Model (隐马尔科夫模型)

Back to TOC

两种问题特征：

基于序列的，比如时间序列，或者状态序列
两类数据，一类序列数据是可以观测到的，即观测序列；而另一类数据是不能观察到的，即隐藏状态序列，简称状态序列

定义

Back to TOC

假设 $N$ 是可能的隐藏状态数， $M$ 是可能的观测状态数，定义
$\mathcal{Q}=\{q_1,q_2,\dots,q_N\},\mathcal{V}=\{v_1,v_2,\dots,v_M\}$
分别为所有可能的隐藏状态和所有可能的观测状态的集合
同时，对于一个长度为 $T$ 的序列 $I$ ，和对应的观测序列 $O$
$\mathcal{I}=\{s_1,s_2,\dots,s_T\},\mathcal{O}=\{o_1,o_2,\dots,o_T\}$
HMM做了两个很重要的假设：

齐次马尔科夫链假设。任意时刻隐藏状态只依赖于它前一个隐藏状态
定义状态转移概率 $A_{ij}$ 为从当前时刻 $t$ 的状态 $s_i$ 转移到下一时刻 $t + 1$ 的状态 $s_j$ 的概率，即
$A_{ij}=P(s_{t+1}=q_j|s_t=q_i)$
从而定义状态转移矩阵 $A\in \mathbb{R}^{N\times N}$
观测独立性假设即任意时刻的观测状态只仅仅依赖于当前时刻的隐藏状态。定义生成概率 $B_{ij}$ 为由隐藏状态 $s_i$ 生成观测状态 $q_j$ 的概率，即
$B_{ij}=P(o_t=v_i|s_t=q_j)$
从而定义生成概率矩阵(发射矩阵) $B\in \mathbb{R}^{N\times M}$
最后，定义在 $t$ 时刻的隐藏状态分布 $\Pi_t=[\pi_t (k)]$ ，其中 $\pi_t (k)=P(s_t=q_k)$
因此一个HMM模型主要由三个参数表示：
$\lambda=(A,B,\Pi)$

基本问题

Back to TOC

1. 评估观察序列概率。给定模型 $\lambda$ 和观测序列 $\mathcal{O}$ ，计算在模型 $\lambda$ 下该观测序列 $\mathcal{O}$ 出现的概率 $P(\mathcal{O}|\lambda)$ 。求解方法：前向后向算法
1. 预测问题。给定观测序列 $\mathcal{O}=\{o_1,o_2,\dots,o_T\}$ 和模型参数 $\lambda=（A,B,\Pi)$ ，求解最有可能出现的隐藏状态序列。求解方法：Viterbi算法
1. 模型参数学习问题。给定观测序列 $\mathcal{O}=\{o_1,o_2,\dots,o_T\}$ ，求解模型参数 $\lambda=（A,B,\Pi)$ 使得 $P(\mathcal{O}|\lambda)$ 最大。求解方法：Baum-Walch算法(EM算法)

前向算法

Back to TOC
在这里插入图片描述

算法流程

输入：观测序列 $\mathcal{O}=\{o_1,o_2,\dots,o_T\}$ ，模型参数 $\lambda=（A,B,\Pi)$
输出：观测序列 $P(O|\lambda)$
步骤：

计算时刻1各个隐藏状态 $s_i$ 的前向概率
$\alpha_1(i)=\pi(i)B_{i,o_1},i=1,2,\dots,N$
递推 $2,3,\dots,T$ 时刻的前向概率
$\alpha_{t+1}(i)=[\sum_{j=1}^{N}\alpha_{t}(j)A_{ji}]B_{i,o_{t+1}},i=1,2,\dots,N$
最终结果
$P(\mathcal{O}|\lambda)=\sum_i^N\alpha_T(i)$

实现代码

def HMMfwd(pi, a, b, obs):
    '''
    pi:初始概率分布
    a:状态转移矩阵
    b:发射矩阵
    obs:观测序列
    '''

    nStates = np.shape(b)[0]
    T = np.shape(obs)[0]

    alpha = np.zeros((nStates,T))
    '''alpha[i,t]表示上述公式的 alpha_t(i)'''
    alpha[:,0] = pi*b[:,obs[0]]

    for t in range(1,T):
        for s in range(nStates):
            alpha[s,t] = b[s,obs[t]] * np.sum(alpha[:,t-1] * a[:,s])

    return alpha