HMM模型及其在中文分词中的应用

笑嘻嘻_2019

已于 2023-03-14 16:23:13 修改

阅读量442

点赞数 3

分类专栏： NLP 文章标签：中文分词自然语言处理

于 2023-03-14 16:14:12 首次发布

本文链接：https://blog.csdn.net/HolleWord2018/article/details/129518169

版权

HMM模型及其在中文分词中的应用

马尔可夫模型
隐马尔可夫模型

隐马尔可夫模型是一种概率模型，用于解决序列预测问题，可以对序列数据中的上下文进行建模。HMM用于描述含有隐含未知参数的马尔可夫过程。在HMM中，有两种类型的节点，分别为观测序列与状态序列。状态序列是不可见的，它们的值是需要通过对观测序列进行推断而得到的。很多现实应用可以抽象为此类问题，如语音识别、分词、词性标注、计算机视觉中的动作识别等。HMM在这些问题中得到了成功的应用。

马尔可夫模型

马尔可夫模型描述的是一类典型的随机过程，即系统的状态随时间变化而随机变化的过程。马尔可夫模型由有限状态集 $s$ 、初始时刻的状态概率分布 $\pi$ 和 状态转移概率矩阵 $A$ 三部分组成，有了这三部分，马尔可夫模型可以计算出系统每一时刻处于各种状态的概率。

下面我们先具体介绍一下这三部分：

有限状态集 $s$

设一个系统有有限个状态 $S=\{s_1,s_2,...,s_N\}$ 。随着时间推移，该系统将从某一状态转移到另一状态。从1时刻开始到T时刻为止，系统所有时刻的状态值构成一个随机变量序列，即状态序列，如下所示：

$Q=q_1,q_2,...,q_t$

其中， $q_i$ 表示第 $i$ 时刻系统的状态，其具体取值未知，但应在上述有限个状态 $S=\{s_1,s_2,...,s_N\}$ 中取值。

初始时刻的状态概率分布 $\pi$

初始时刻的状态概率分布为：

$\pi=(\pi_1,\pi_2,...,\pi_N),1 \le i \le N$

其中， $\pi=(\pi_1,\pi_2,...,\pi_N)$ 满足下列各条件：

$\pi_i=P(q_1=s_i)$

$\pi_i \ge 0$

$\sum\limits_{i=0}^N \pi_i =1$

状态转移概率矩阵 $A$

系统在不同时刻可以处于同一种状态，但在任一时刻只能有一种状态。不同时刻的状态之间是有关系的。时刻t的状态由它之前时刻的状态决定，即当前时刻t处于状态的概率取决于其在时间1,2,…,t-1时刻的状态，系统状态的条件概率如下所示：

$P(q_t|q_1,q_2,...,q_{t-1})$

上式中的条件概率要考虑之前所有时刻的状态，计算起来较为复杂，为此需要进行简化。如果假设t时刻的状态只与t-1时刻的状态有关，与更早的时刻无关，则上式的条件概率可简化为如下所示。

$P(q_t|q_1,q_2,...,q_{t-1})=P(q_t|q_{t-1})$

上式称为一阶马尔可夫假设，满足这一假设的马尔可夫模型称为一阶马尔可夫模型。

设 $t - 1$ 时刻的状态为 $s_j$ ， $t$ 时刻的状态为 $s_j$ ，条件概率 $P(q_t|q_{t-1})$ 构成一个 $\times N$ 的矩阵 $A$ （如下图，从 $t - 1$ 时刻到 $t$ 时刻的状态转移共有 $\times N$ 种可能），称为状态概率转移矩阵，具体可表示为：

$\begin{pmatrix} P(q_t=s_1|q_{t-1}=s_1) & P(q_t=s_2|q_{t-1}=s_1) & \dots & P(q_t=s_N|q_{t-1}=s_1) \\ P(q_t=s_1|q_{t-1}=s_2)& P(q_t=s_2|q_{t-1}=s_2) & \dots & P(q_t=s_N|q_{t-1}=s_2) \\ \vdots & \vdots & \dots & \vdots \\ P(q_t=s_1|q_{t-1}=s_N) & P(q_t=s_2|q_{t-1}=s_N) & \dots & P(q_t=s_N|q_{t-1}=s_N)\\ \end{pmatrix}$