MEMMs(Log-Linear Tagging Models)

最新推荐文章于 2023-12-01 16:03:10 发布

潜心修行的研究者

最新推荐文章于 2023-12-01 16:03:10 发布

阅读量885

点赞数

分类专栏：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h2026966427/article/details/80302167

版权

自然语言处理专栏收录该内容

23 篇文章 6 订阅

订阅专栏

和HMMs相比，Log-Linear Tagging Models的核心优势在于它高度灵活的表示，它可以让丰富的特征在模型中很容易地聚合起来！

提示：MEMMs和Log-Linear Tagging Model是同一个模型，因为ME本质上就是Log-Linear Model，而且MEMMs中用到的马尔可夫假设和HMM中用到的是几乎一样。只不过MEMMs是一个判别模型，它学习的是一个条件分布！

条件标注模型

有三个核心问题需要解决：

我们用对数线性模型来定义条件标注模型，用对数线性模型的参数估计方法来估计参数，用维特比算法的变形来寻找最优标注序列即解码问题。

1，Trigram MEMMs

在理解玩HMM和对数线性模型之后，这个模型就变得十分简单了。

我们的根本任务是对以下条件分布建模：
首先利用链式法则和二阶马尔可夫假设对以上的条件分布进行分解，得到：
利用对数线性模型对以下概率进行估计：

其中，必须理解 $h_i$ 的定义。

则Trigram MEMMs的正式定义如下：

2，Features in Trigram MEMMs

Trigram MEMMs容易聚合大量特征的优点使得它比Trigram HMM强的多！而且Trigram MEMMs可以聚合任意形式的特征！

主要特征有：

Word/tag feature：类似HMM中的e(x|y)。
Prefix and Suffix feature：拼写特征，类似HMM中的那些低频词中的伪词。
Trigram,Bigram and Unigram Tag features：词性搭配特征，类似HMM中的q(VB|DT,JJ)。
Other Contextual Features
Other Features

3，Trigram MEMMs的参数估计

和对数线性模型的方法一样，通过最大似然估计将其转化为最优化问题。

对数似然函数如下：

则所估计的参数为：

4，MEMMs的解码问题

解码问题如下：

维特比算法求解：

MEMMs中的维特比算法的递归式和HMM中的维特比算法的递推式区别很小，如下：

算法详细流程如下：

还是比较容易理解的。

5，总结

由于MEMMs仍然存在标注偏置问题，所以之后又有了CRF！，它们之间的能力：CRF>MEMM>HMM。

潜心修行的研究者

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
MEMMs(Log-Linear Tagging Models)

和HMMs相比，Log-Linear Tagging Models的核心优势在于它高度灵活的表示，它可以让各种特征在模型中简单的聚合！提示：MEMMs和Log-Linear Tagging Model是同一个模型，因为ME本质上就是Log-Linear Model，而且MEMMs中用到的马尔可夫假设和HMM中用到的是几乎一样。只不过MEMMs是一个判别模型，它学习的是一个条件分布！条件标注...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。