NLP--3--隐马尔可夫模型HMM

最新推荐文章于 2021-05-13 17:48:51 发布

ortyi

最新推荐文章于 2021-05-13 17:48:51 发布

阅读量196

点赞数

分类专栏： NLP 文章标签： nlp

本文链接：https://blog.csdn.net/ortyijing/article/details/95461908

版权

NLP 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

说明：这部分是统计自然语言处理中比较重要的部分，目前作为了解，了解其思想，有时间再补充细节。
隐马尔可夫模型（Hidden Markov Model，HMM）
可见状态链
隐含状态链：隐含状态之间存在转换概率（transition probability），马尔科夫状态链指的是隐含状态链。
输出概率（emission probability）： 隐含状态和可见状态之间的一个概率。
HMM模型主要用来求解三类问题:
假设隐含状态的个数为N，可见状态链的长度为T。
- (0) 为其他三个问题铺垫，知道隐含状态数量，转换概率，隐含状态链，根据可见状态链，求解出现这个结果的概率。
  解决方法：直接计算。
- (1) 预测问题-----知道隐含状态数量，转换概率，根据可见状态链，求解隐含状态链。
  解决方法：
  a. 通过穷举求解最大似然状态路径， $O(N^T)$ 。
  b. 维特比算法（Viterbi algorithm）， $O (N * N * T)$ 。
- (2) 概率计算问题-----知道隐含状态数量，转换概率，根据可见状态链，求解出现这个结果的概率。
  解决方法：
  a. 穷举遍历， $O(N^T)$ 。
  b. 前向算法（forward algorithm）， $O (N * T)$ 。
  c. 后向算法（backward algorithm）， $O (N * T)$ 。
- (3) 学习问题-----知道隐含状态数量，不知道转换概率，观测到很多可见状态链，想反推出每个转换概率。
  解决方法：鲍姆-韦尔奇算法（Baum-Welch Algo），即EM算法。
形式化定义中的概念
- 状态序列，即隐含状态序列，设 $Q$ 是所有可能状态的集合 $Q=q_1,q_2,\dots,q_N$ ， $I$ 是长度为 $T$ 的状态序列 $I=i_1,i_2,\dots,i_T$ 。
- 观测序列，即可见状态序列，设 $V$ 是所有可能观测的集合 $V=v_1,v_2,\dots,v_M$ ， $O$ 是 $I$ 对应的观测序列 $O=o_1,o_2,\dots,o_T$ 。
- 状态转移矩阵： $A=[a_{ij}]_{N\times N}$
- 观测概率矩阵： $B=[b_{jk}]_{N\times M}$
- 初始状态概率向量： $\pi=(\pi_{i})$ , $\pi_i=P(i_1=q_i)$
- 隐马尔可夫模型的三要素： $\lambda=(A,B,\pi)$