图解隐马尔可夫模型（HMM）

最新推荐文章于 2024-08-09 12:14:25 发布

敷衍zgf

最新推荐文章于 2024-08-09 12:14:25 发布

阅读量809

点赞数 2

分类专栏：笔记自然语言处理NLP 文本挖掘文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45556665/article/details/127308265

版权

笔记同时被 3 个专栏收录

73 篇文章 9 订阅

订阅专栏

自然语言处理NLP

45 篇文章 9 订阅

订阅专栏

26 篇文章 3 订阅

订阅专栏

本文介绍了隐马尔可夫模型（HMM）在文本处理中的应用，包括模型训练过程，如何根据语料库获取隐藏状态标识，以及预测阶段的初始概率矩阵、转移概率矩阵和发射概率矩阵的构建。重点讨论了维特比算法在降低预测计算复杂度中的作用，为后续深入讲解该算法奠定了基础。

摘要由CSDN通过智能技术生成

隐马尔可夫模型(HMM)的训练与预测

一、HMM模型训练

首先我们的语料库为三段文本：
1.今天天气真不错。
2. 麻辣肥牛好吃！
3. 我喜欢吃好吃的！
那么每一个字都有一个标识（“隐藏状态”）可以根据语料库得到所有标识
B：词语开始 M：词语中间 E：词语结束 S：单独出现
在这里插入图片描述

二、HMM模型预测

对于给定的待预测文本，需要通过HMM模型进行预测，待预测文本不一定存在语料库中，通过初始概率矩阵、转移概率矩阵、发射矩阵计算所有可能性的概率，最后通过维比特算法计算出最终结果。
在这里插入图片描述

三、初始概率矩阵

初始矩阵一开始统计的都是每一个字出现在文本中的频次。初始概率矩阵中存放的是归一化之后的值。
在这里插入图片描述

四、转移概率矩阵

在这里插入图片描述
可以从右下角的表格中简单的验证一下，例如BE有6个…，并计算概率
在转移概率矩阵当中有一个很重要的特征，每一行之和为1

五、发射概率矩阵

在这里插入图片描述
发射概率矩阵的行表示标识数目，每一列表示一个字，综合起来看就是，在某个标识的条件下，发射到某个字的概率。
发射概率矩阵有一个很重要的特征就是，每一行的概率之和为1

六、模型预测

在这里插入图片描述
这里只列出来了一种计算，如果通过穷举法：一共有4⁷ 次计算。
因此需要采用维特比算法降低算法复杂度，降低计算次数。
维特比算法下节会仔细讲解！敬请期待！

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

敷衍zgf 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。