HMM

最新推荐文章于 2023-09-20 22:28:05 发布

非技术簇拥

最新推荐文章于 2023-09-20 22:28:05 发布

阅读量1.6k

点赞数 1

分类专栏：笔记整理文章标签： HMM 隐马尔可夫删除插值 hmm推导序列标注

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/side_two/article/details/81432346

版权

笔记整理专栏收录该内容

4 篇文章

订阅专栏

什么是隐马尔可夫模型？是生成式模型，表示状态序列和观察序列的联合分布P(S,O)，可以描述隐藏的马尔科夫链生成观测序列的过程，是关于时序的概率模型。O是观察状态序列，S是隐藏状态序列。
P(S,O)的推导：

这个式子是对HMM三个问题中，求序列概率的表达，给出了计算P(S,O)的公式，由前向/后向算法解决。

HMM序列标注问题中P(S|O)推导：

即表达了HMM中已知观察序列求解最优隐藏状态序列：argmaxP(S|O)，由viterbi求得全局最优。

从以上两个式子中，可以看出，需要得到P(si|si-1)（转移概率）、P(oi|si)（发射概率）和P(s0)（初始隐藏状态概率），这就抛出了HMM第三个问题：估计这些HMM设计的参数值，通常监督下基于极大似然估计。

HMM的实现：HMM原理简单，但实现的时候有许多细节需要考虑，包括转移概率的平滑（拉普拉斯、删除差值等）、未登录词处理（+1等），还包括发射概率的平滑（很少见提到发射概率平滑的论文，可能我个人认识有什么误区）。
https://github.com/doubleEN/postagging

HMM的增量式学习：统计词频计算概率，HMM支持增量学习很直观。

二阶隐马的viterbi过程：

假设隐藏状态有两种A,B，则二阶隐马的隐藏状态转移过程如上，相比一阶，二阶的转移在一个更小的局部选择最优。即t+1时的AA在t时的BA、AA上选择最优。
注意在二阶时，依然遵循观察独立假设，即P(Oi|Si)，也有的是P(Oi|Si-1，Si)，后者易造成稀疏。

关于删除差值平滑转移概率：

式子右边的P都是在训练集上求得的，而系数是在留存数据中得到的，系数的产出方式：

参考：
《自然语言处理综述》
《统计自然语言处理》宗成庆
《speech and language processing》
《统计学习方法》
hankcs博客

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。