HMM隐马尔可夫模型学习总结

最新推荐文章于 2025-04-06 14:11:51 发布

搬砖民工金币

最新推荐文章于 2025-04-06 14:11:51 发布

阅读量6.2k

点赞数 2

分类专栏：语音识别文章标签： HMM 隐马尔可夫语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011930705/article/details/81738096

版权

本文详细介绍了HMM（隐马尔可夫模型）的基本概念及在实际中的应用，包括评估问题、预测问题和学习问题。通过Baum-Welch训练模型，结合前向算法、后向算法和Viterbi算法进行序列分析。同时，讨论了HMM在语音识别中的应用，如最大互信息估计和大词汇连续语音识别，以及如何处理声调和上下文相关问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

介绍

HMM在实际应用中主要用来解决3类问题。

1.评估问题(概率计算问题)

即给定观测序列 O=O1O2…Ot和模型参数λ=(A,B,π)，怎样有效计算这一观测序列出现的概率P(O|λ)

2.预测问题 (也称解码问题)

即给定观测序列 O=O1O2…Ot和模型参数λ=(A,B,π)，怎样寻找满足这种观察序列意义上最优的隐含状态序列S。

3.学习问题。

即HMM的模型参数λ=(A,B,π)未知，如何求出这3个参数以使观测序列O=O1O2…Ot的概率尽可能的大,可以使用极大似然估计参数(EM算法)。

4.个人理解

通过Baum-Welch训练HMM模型，然后输入需要判断的数据通过前向后向算法计算确定属于哪个模型，最后通过viterbi解码隐含状态序列

前向算法

问题：给定观察值序列O=o1,…,oT以及一个模型λ=(π,A,B ) 时产生出O的概率P(O|λ)？

前向向量定义：at(i) = P(o1 o2 …ot,qt=i|λ)
前向算法过程如下：

（1）初始化：a1(i) = πibi(O1), 1≤i≤N

（2）递推:

,1≤j≤N,1≤t≤T-1

t+1时刻状态j的概率值为t时刻每一个状态的概率值与其对应转移函数相乘的累积和再与观察值概率相乘

（3）终止:

其中：

下面解释这个算法：

该图为初始状态，输出观察值为O1 ，图中显示3个状态对应算法初始化公式，而该序列观察值所得概率为：

P(O1| ）= π1b1(O1)+π2b2(O1)+π3b3(O1)=α1(1)+α1(2)+α1(3)

该图为一次递推过程，输出观察值为O1 O2，图中O2对应的状态1的概率是通过O1对应的3个状态通过递推公式求得，该结果为：

P(O1 O2,q2=θ1| ）= α1(1)a11b1(O2)+ α1(2)a21b1(O2)+ α1(3)a31b1(O3)

以此类推可以得到P(o1 o2 …ot|λ)

前向算法计算P(O|M)过程：

step1： α1(1) =π1b1(red)=0.2*0.5=0.1

α1(2)=π2b2(red)==0.4*0.4=0.16

α1(3)=π3b3(red)==0.4*0.7=0.21

step2：α2(1)=α1(1)a11b1(white)+α1(2)a21b1(white)+α1(3)a31b1(white)

...

step3:P(O|M) = α4(1)+α4(2)+α4(3)

前向算法实现代码参考此链接：

最低0.47元/天解锁文章

搬砖民工金币

博客等级

码龄12年

39
原创

31
点赞

159
收藏

38
粉丝

关注

私信

热门文章

分类专栏

NLP
java 14篇
windows 2篇
Android 1篇
算法珠玑 8篇
C# 1篇
C++ 4篇
ubuntu 3篇
语音识别 7篇
python 5篇
声纹识别 1篇
kaldi 3篇
Elasticsearch 1篇
springboot 1篇
Hadoop 3篇

展开全部收起

最新评论

ERNIE转化为pytorch可用模型记录
御羽与鱼: 我直接下载的ernie模型预测的为什么不一样啊，预测的乱七八糟的，一点关系都没有：Predicted token is: ['孑', '偌', '偌', '荇', 'count', '荇', '戌', '偌', '孑', '絮', '荇', '詈', '厥', '雇', '垩', '荇', '荇', '疙', '壑', 'type', '##rence', '跋', '别', '疙', '偌', '偌', '跋', '别', '疙', '荇', '##3c', '跋', '荇', '废', '罢', '荇', '孑', '荇', '碣', '偌', '娶', '滂', '秩', '秩', '孑']
从yesno模型入门kaldi语音识别
玉蝴蝶恋花心动: 真的好细，细到离谱的那种细
基于ASRT中文语音识别系统的优化
搬砖民工金币: 前公司已经把该项目申请了专利《一种基于MVGG-CTC的关键词搜索方法》，申请号 CN202110752816.X 公开(公告)号 CN113470627A，有兴趣就去看看吧
基于ASRT中文语音识别系统的优化
搬砖民工金币: 前公司已经把该项目申请了专利《一种基于MVGG-CTC的关键词搜索方法》，申请号 CN202110752816.X 公开(公告)号 CN113470627A，有兴趣就去看看吧
二进制求和(练习python)
weixin_45477247: 哈哈哈进制转换，老哥这个思路真的厉害，利用内置函数直接转化加起来再转换就OK了，！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

搬砖民工金币 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。