GMM-HMM声学模型实例详解（标贝科技）

DataBaker标贝科技

已于 2022-04-13 11:57:27 修改

阅读量4.3k

点赞数 8

分类专栏：语音基本概念文章标签：语音识别人工智能机器学习

于 2022-01-17 11:38:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DataBaker/article/details/122534700

版权

本文深入浅出地讲解了GMM-HMM声学模型，从混合高斯分布和最大似然估计理论出发，通过EM算法实例演示参数更新过程，并探讨了在语音识别中的应用。

摘要由CSDN通过智能技术生成

欢迎测试标贝科技AI开放平台 https://ai.data-baker.com/#/?source=qwer12

GMM-HMM声学模型实例详解

GMM-HMM为经典的声学模型，基于深度神经网络的语音识别技术，其实就是神经网络代替了GMM来对HMM的观察概率进行建模，建模解码等识别流程的格个模块仍然沿用经典的语音识别技术
接下来我将从GMM、最大似然估计到EM算法实例，再到最后使用一段语音介绍GMM-HMM声学模型参数更新过程

一、GMM (混合高斯分布)

1、正态分布(高斯分布)
如果你绘制出来的概率分布是一条钟型曲线，且平均值、众数和中位数都是相等的，那么随机变量X就服从正态分布，记为X~N(μ，σ2),正态分布概率密度函数：在这里插入图片描述
其中，μ是随机变量的均值，控制曲线的位置，σ^2控制曲线的陡峭程度

2、GMM (混合高斯分布)：
假设一批数据由三个不同的高斯分布生成，将这批数据混在一起，该分布就称为高斯混合分布，从数学上讲，认为这批数据的概率分布密度函数可以通过加权函数表示：
在这里插入图片描述

在这里插入图片描述

二、最大似然估计：

最大似然估计：使用概率模型，找到模型中的参数能够以较高概率产生观察数据；简单来说就是给定一组观察数据评估模型参数的方法。
比如：要统计全国成年人的身高分布情况，测量全部人口的身高耗费人力物力，假设身高服从正态分布，抽取1000人(抽取样本太少估计出的参数会不太准确)，根据这1000人的身高分布估计全国人口的身高分布情况，已知身高服从正态分布，n个人的最大似然函数表示为：
在这里插入图片描述

(1)直接求L的最大值可能不太好求，等式两边同时取对数，根据对数的性质可以将乘除法法转变为加减法

最低0.47元/天解锁文章

DataBaker标贝科技

关注

8
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
GMM-HMM声学模型实例详解（标贝科技）

GMM-HMM声学模型实例详解GMM-HMM为经典的声学模型，基于深度神经网络的语音识别技术，其实就是神经网络代替了GMM来对HMM的观察概率进行建模，建模解码等识别流程的格个模块仍然沿用经典的语音识别技术接下来我将从GMM、最大似然估计到EM算法实例，再到最后使用一段语音介绍GMM-HMM声学模型参数更新过程一、GMM (混合高斯分布)1、正态分布(高斯分布)如果你绘制出来的概率分布是一条钟型曲线，且平均值、众数和中位数都是相等的，那么随机变量X就服从正态分布，记为X~N(μ，σ2),正态分布概
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。