HMM算法在语音识别中的应用——算法学习

最新推荐文章于 2024-07-05 04:00:00 发布

yzbx

最新推荐文章于 2024-07-05 04:00:00 发布

阅读量5k

点赞数

分类专栏：算法学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010598445/article/details/51681413

版权

算法学习专栏收录该内容

27 篇文章 0 订阅

订阅专栏

总体框架

这里写图片描述

输入

Treat acoustic(听觉的) input O as sequence of individual observations

O = o 1, o 2, . . ., o t

$O=o_1,o_2,...,o_t$

结果

Define sentence as a sequence of words

W = w 1, w 2, . . ., w n

$W=w_1,w_2,...,w_n$

判断模型

最大概率： $W=\mathop{arg \ max}_{W \in L}{\ P(W|O)}$
贝叶斯： $W=\mathop{arg \ max}_{W \in L}{\ \frac {P(O|W)P(W)} {P(O)}}$
化简：由于 $P(O)$ 对所有 $W$ 一样， $W=\mathop{arg \ max}_{W \in L}{\ {P(O|W)P(W)} }$

模型

这里写图片描述

Feature Extraction: 39 “MFCC” features
Acoustic Model: Gaussians for computing p(o|q)
Lexicon(词典)/Pronunciation(发音) Model: HMM, what phones can follow each other
Language Model: N-grams for computing $p(w_i|w_{i-1})$

markov chian

states: $Q = q_1,q_2,...,q_N$ , $q_t$ is the state at time t.
transition probability: A=[a11,a12,...,aNN]
- $a_{ij}$ is the probability of trasition from i to j.
- $a_{ij}=P(q_{t-1}=i|q_t=j)$
- $\sum_{j=1}^N {a_{ij}} = 1$ , for $i \in [1,N]$
markov assumption:
- $P(q_i|q_1q_2...q_{i-1})=P(q_i|q_{i-1})$
initial status
- $\pi _i =P(q_1=i)$
- $\sum_{j=1}^N {\pi _j}=1$

hidden markov chian

这里写图片描述

three problem

这里写图片描述

thrid problem

这里写图片描述

以上所有内容从以下附件中抽取

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。