HMM、MEMM、CRF模型的比较

最新推荐文章于 2022-12-02 11:23:06 发布

Chris_34

最新推荐文章于 2022-12-02 11:23:06 发布

阅读量1.1k

点赞数 2

分类专栏：机器学习课程笔记文章标签： CRF HMM MEMM

本文链接：https://blog.csdn.net/weixin_43199584/article/details/102024219

版权

机器学习课程笔记专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、HMM

在这里插入图片描述
HMM属于生成模型，模型中2个假设：

输出观测值 $X_i$ 之间相互独立；
齐次一阶Markov,即状态的转移过程中当前状态只与前一状态有关。

二、MEMM

在这里插入图片描述
$O)=\prod_{t=1}^{n} \frac{\exp \left(\sum_{a}\right) \lambda_{a} f_{a}(o, i)}{Z\left(o, i_{i-1}\right)}, i=1, \cdots, n$
求和的作用在概率中是归一化，但是这里归一化放在了指数内部，管这叫local归一化。来了，viterbi求解过程，是用dp的状态转移公式（MEMM的没展开，请参考CRF下面的公式），因为是局部归一化，所以MEMM的viterbi的转移公式的第二部分出现了问题，导致dp无法正确的递归到全局的最优。
$\delta_{i+1}=\max _{1 \leq j \leq m}\left\{\delta_{i}(I)+\sum_{i}^{T} \sum_{k}^{M} \lambda_{k} f_{k}\left(O, I_{i-1}, I_{i}, i\right)\right\}$

MEMM模型属于判别模型，打破了观察值之间相互独立产生的问题，但是由于状态之间的假设理论，MEMM倾向于选择拥有更少转移的状态，使得该模型存在 标注偏置问题（label bias problem）。

三、CRF（Conditional Random Field）

在这里插入图片描述
从概率图可以很形象的看出一个区别：
HMM是有向图，严格定义了y的有序性，只能从左至右。CRF是无向图，y无序，可左可右。HMM是生成模型，通过求联合概率获得；CRF是判别模型，通过条件概率求得。在如词性标注上的应用中CRF更合理，因为它直接求某个标注的概率，而HMM需要先算联合概率再转而求目标的概率。
对于所谓的条件和随机场的理解：

条件：属于生成模型
随机场：无向图模型
CRF模型属于判别模型，解决了标注偏置问题，去除了HMM中两个不合理的假设，当然，模型相应得也变复杂了。
CRF建模公式如下，整个过程的推导可以结合这个词性标注的案例更好理解：CRF词性标注：
$O)=\frac{1}{Z(O)} \prod_{i} \psi_{i}\left(I_{i} | O\right)=\frac{1}{Z(O)} \prod_{i} e^{\sum_{k} \lambda_{k} f_{k}\left(O, l_{i-1}, I_{i}, i\right)}=\frac{1}{Z(O)} e^{\sum_{i} \sum_{k} \lambda_{k} f_{k}\left(O, I_{i-1}, I_{i}, i\right)}$
因为是判别模型，所以直接为了确定边界而去建模，因为创造出来就是为了这个分边界的目的。比如说序列求概率（分类）问题，直接考虑找出函数分类边界。所以才为什么会有这个公式。所以再看到这个公式也别懵逼了。