基于HMM的语音识别（一）

最新推荐文章于 2022-07-29 13:51:30 发布

qq_23660243

最新推荐文章于 2022-07-29 13:51:30 发布

阅读量1.9w

点赞数 3

分类专栏：语音识别文章标签： HMM 语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23660243/article/details/80821617

版权

利用业余时间写一下自己看书的感受，就当作随笔把，这样也能帮助自己记忆，同时关于kaldi的章节我选择先停一停，我感觉把这个问题理解透再去查看kaldi可能会事半功倍。我选取的章节来源于"The Application of Hidden Markov Models in Speech Recognition",英文版的，有兴趣的可以去看看。废话不多说，我们直接进入主题。

下图显示了大型连续语音词汇识别的主要部分：

说实话看这图要不是我会语音增强的部分知识的话，我会认为很简单，的确，图看上去确实很简单，不过任何一个细节拿出来都足以让我们翻阅无数资料。如图，输入的波形（语音）被转化固定长度的语音响亮序列：

这个过程称之为特征提取，也就是著名的Feature Extraction（不要看到公式就害怕，就是有序的向量的排列）。那么解码器（Decoder）就会尝试去寻找最可能产生如上Y的字：w1:L=w1,....wL 的序列,假如decoder尝试寻找

（PS：哇，看到这里我突然想到了为什么要训练模型了）。

最低0.47元/天解锁文章

关注

3
点赞
踩
41

收藏

觉得还不错? 一键收藏
12
评论
基于HMM的语音识别（一）

利用业余时间写一下自己看书的感受，就当作随笔把，这样也能帮助自己记忆，同时关于kaldi的章节我选择先停一停，我感觉把这个问题理解透再去查看kaldi可能会事半功倍。我选取的章节来源于"The Application of Hidden Markov Models in Speech Recognition",英文版的，有兴趣的可以去看看。废话不多说，我们直接进入主题。下图显示了大型连续语音词汇识...
复制链接

扫一扫

专栏目录

qq_23660243 CSDN认证博客专家 CSDN认证企业博客

码龄10年

65: 原创

38万+: 周排名

132万+: 总排名

51万+: 访问

: 等级

4126: 积分

527: 粉丝

190: 获赞

228: 评论

723: 收藏

私信

关注

热门文章

分类专栏

语音识别 8篇
语音增强 7篇
通用算法 4篇
大数据 24篇
Java 21篇
Scala 6篇
Python 3篇
C 2篇
C++ 1篇
Linux 1篇

最新评论

频域LCMV
qq_40304760: github的地址你还有吗
频域GSC
qq_40304760: git在哪呢
频域LCMV
weixin_45857549: 博主你好，请问你文中提到的论文是哪一篇呢？
C++读取Wav文件
中号草莓派: 为什么我用matlab得到的数据量比这个读取的数据量大十倍，是我参数设置的不对吗？
Matlab ULA 仿真
heavy_truck: 楼主，宽频MVDR语音增强会做吗

最新文章

目录

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。