【自然语言处理】— 隐马尔可夫模型详解、例解

最新推荐文章于 2025-04-06 14:11:51 发布

之墨_

最新推荐文章于 2025-04-06 14:11:51 发布

阅读量1.2k

点赞数 1

分类专栏： NLP 文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56462041/article/details/133816129

版权

NLP 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了自然语言处理中的隐马尔可夫模型(HMM)，包括其基本概念、关键要素（隐含状态、可见状态、状态转移概率和观测概率）、数学表示以及在掷骰子示例中的应用。模型由状态转移矩阵、观测概率矩阵和初始状态概率向量共同决定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【自然语言处理】— 隐马尔可夫模型

【自然语言处理】— 隐马尔可夫模型

【自然语言处理】— 隐马尔可夫模型

引例

假设有三种不同的骰子，分别是立方体，正四面体，正八面体，分别有1-6，1-4，1-8，分别记作D6、D4、D8。每个面出现的概率分别是1/6，1/4，1/8。
在这里插入图片描述

在不观察的情况下，从三个骰子中随机选一个，进行抛掷，结果可能是1-8中的任意数字。依照这种方式，随机选择骰子，重复抛掷，可以得到一串数字，这串数字对我们是可见的，并且直接记录下来了，因此将这串数字记作可见状态链
在这里插入图片描述
在抛掷的过程中，被我们随机选择的骰子编号也组成了一串序列，因为我们是随机选择的骰子，因此将这串序列称为隐含状态链

实验过程中产生了两个数据链，隐含状态链和可见状态链，隐马尔可夫模型=隐含状态链➕可见状态链
在这里插入图片描述

隐马尔可夫模型概念

隐马尔可夫模型（Hidden Markov Model），简称HMM，它是关于时序的概率模型，该模型包含随机生成的不可观测序列，该序列被称为状态序列，使用S表示，每个不可观测状态都会产生一个可观测的结果，这样会得到一个观测序列，使用O表示。

在这里插入图片描述

每个状态和时刻都会与一个时刻进行对应，如果有t个时刻，就产生了 $s_1→s_t，o_1→o_t$ ，相当于一次一次掷骰子，t就代表第几次掷骰子
在这里插入图片描述

在HMM中，状态序列是隐藏的，无法被观测到，因此状态变量是一个隐变量，隐藏的状态序列是由一个马尔可夫链，随机生成的

隐马尔可夫模型的关键

在隐马尔可夫模型中，包含了四个关键因素，分别是：

隐含状态
可见状态
隐含状态转换
可见状态输出

在这里插入图片描述

各个隐含状态之间会进行转换，存在着对应的转换概率

隐含状态会输出可见状态，隐含状态和可见状态之间有一个输出概率，不同隐含状态到可见状态的输出概率可能不同

例如，隐含状态D6输出可见状态1到6概率是 $\cfrac{1}{6}$ ，隐含状态D4输出可见状态1到4概率是 $\cfrac{1}{4}$ ，

在这里插入图片描述

隐马尔可夫模型的数学表示

为了进一步讨论隐马尔可夫模型，需要使用数学符号来表示HMM，其中包括隐含状态 $Q$ 和观测结果 $V$ 两个集合，状态转移概率矩阵 $A$ ，观测概率矩阵 $B$ ，初始状态概率向量 $\pi$ ，三个概率矩阵。

隐含状态与观测结果

例如，隐含状态集合 $Q = \{q_1,q_2,...,q_n\}$ 包括 $q_1到q_n n$ 种状态
观测结果集合 $V=\{v_1,v_2,...,v_m\}$ 包括 $v_1到v_m m$ 种可能的结果

在掷骰子的案例中， $n=3\ \ \ q_1,q_2,q_3对应D_6,D_4,D_8$
$m=8 \ \ \ v_1到v_8对应数字1到8$

在这里插入图片描述

状态转移矩阵

状态转移的概率矩阵 $A$ 是一个是一个 $N * N$ 的矩阵
在这里插入图片描述

其中 $a_{ij}$ 代表了状态 $q_i$ 转移到状态 $q_j$ 的概率
在这里插入图片描述
具体地， $a_{ij}等于在s_t = q_i的条件下，s_{t+1}=q_j的概率$

在这里插入图片描述
例如，3个骰子，选择任意骰子的概率都是 $\cfrac{1}{3}$ ，那么就得到了 $3 * 3$ 的状态转移概率矩阵，其中的每个元素都是 $0.33$ ，

在这里插入图片描述

观测概率矩阵

观测概率矩阵为 $B$ ，由于每一个状态 $q$ 都可以输出一个观测结果 $v$ ，因此B是一个 $N * M$ 的矩阵

在这里插入图片描述
其中 $b_ij$ 代表了在时刻 $t$ ，状态 $q_i$ 输出观测结果 $v_j$ 的概率。

例如，在掷骰子时，根据三种骰子的输出，可以得到一个 $3 * 8$ 的概率矩阵，第一行对应六面骰子，输出1到6的概率是1/6，输出7和8的概率是0，而第二行和第三行，分别代表投掷四面骰子和八面骰子的输出1到8的概率

在这里插入图片描述

初始状态概率向量

初始状态的概率向量是 $\pi$ ，它是一个 $N * 1$ 的列向量， $\pi_i$ 代表在时刻 $t = 1$ 时，状态为 $q_i$ 的概率，例如，掷骰子时，三种骰子的概率都是1/3
在这里插入图片描述

小结

$\pi和A$ 确定了隐藏的马尔可夫链，也就是如何生成不可观测的状态序列 $S$ ， $B$ 确定了如何从隐藏状态产生观测状态序列 $O$ ，隐马尔可夫模型由 $A、B、\pi$ 共同决定，使用三元符号 $λ=(A,B,\pi)$ 表示。
在这里插入图片描述

参考视频：什么是HMM隐马尔可夫模型，自然语言处理中的最基础算法之一_哔哩哔哩_bilibili

博客等级

码龄4年

287
原创

1208
点赞

4098
收藏

1000
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

2022年12月英语六级预测范文—预测范文：Be Willing To Try
lisifagui: 星火英语（2025）专项特训中的第一篇就是这个！几年过去了依然抗大，作者大大厉害！
Linux服务器安装 Virtuoso 数据库并导入Freebase 知识图谱数据
Keshi787: 下面是崩溃日志：~/autodl-tmp/virtuoso/virtuoso-opensource/database# tail -n 100 virtuoso.log | grep -i "error\|warning" 11:16:12 WARNING: * Monitor: Locks are held for a long time 11:16:22 WARNING: * Monitor: Should read for update because lock escalation from shared to exclusive fails frequently (1) 11:18:19 WARNING: * Monitor: Locks are held for a long time 11:20:20 WARNING: * Monitor: Locks are held for a long time
Linux服务器安装 Virtuoso 数据库并导入Freebase 知识图谱数据
之墨_: 检查一下内存空间？或者接口是否开放或者其他网络问题？
Linux服务器安装 Virtuoso 数据库并导入Freebase 知识图谱数据
Keshi787: 导入数据那里最后为什么会把virtuoso进程自动杀死啊：root~/autodl-tmp/virtuoso/virtuoso-opensource/database# ../bin/isql 1111 dba dba OpenLink Virtuoso Interactive SQL (Virtuoso) Version 07.20.3229 as of Aug 15 2018 Type HELP; for help and EXIT; to exit. Connected to OpenLink Virtuoso Driver: 07.20.3229 OpenLink Virtuoso ODBC Driver No entry for terminal type "xterm-256color"; using dumb terminal settings. SQL> ld_dir('.', 'FilterFreebase', 'http://freebase.com'); Done. -- 2 msec. SQL> rdf_loader_run(); *** Error 08S01: [Virtuoso Driver]CL065: Lost connection to server at line 2 of Top-Level: rdf_loader_run()
【报错】安装SonarQube、SonarScanner在linux服务器上的配置
yingduoduode: /etc/profile 添加sonar-scanner的环境变量已经添加了。也source了。为什么不生效呢。。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

之墨_ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。