第一部分传统的声学模型（更新中）

最新推荐文章于 2022-06-23 17:23:17 发布

WuJia_

最新推荐文章于 2022-06-23 17:23:17 发布

阅读量448

点赞数

文章标签： python 语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WuJia_/article/details/107043196

版权

第一部分总览：
在这里插入图片描述
一、混合高斯模型
1.相关数学基础和公式推导

2. 采用高斯混合分布对语音特征建模
GMM因其拟合任意复杂的、多种形式的分布能力，可以基于GMM的分类方法广泛应用于说话人识别、语音特征降噪与语音识别中。在语音特征降噪和噪声跟踪中，可以采用GMM拟合一个先验分布，在语音识别中GMM被整合在HMM中用于拟合基于状态的输出分布。使用GMM对HMM每个状态的语音特征分布进行建模有很多明显的优势，只要混合的高斯分布数目足够多，GMM可以拟合任意精度的概率分布，并且它可以通过EM算法很容易拟合数据。
GMM参数通过EM算法的优化，可以使其在训练数据上生成语音观察特征的概率最大化，在此基础上，若通过鉴别性训练，基于GMM-HMKM的语音识别系统的识别准确率可以得到显著提升。此外通过输入语音特征中加入由神经网络生成的联合特征和瓶颈特征，语音识别率同样可以得到提升。
但是！ GMM不能有效的对呈非线性或近似非线性的数据进行建模。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。