Python语音基础操作--11.2基于GMM的说话人识别模型

最新推荐文章于 2023-12-09 17:21:50 发布

sinat_18131557

最新推荐文章于 2023-12-09 17:21:50 发布

阅读量2.6k

点赞数 4

分类专栏： Python 语音信号文章标签： python 机器学习语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_18131557/article/details/106441013

版权

这篇博客详细介绍了如何使用Python实现基于GMM的说话人识别模型。内容包括高斯混合模型的概念、参数估计方法——极大似然估计及EM算法，以及在实际应用中处理小值问题的策略。通过提取特征参数并计算不同说话人的模型似然值，来确定识别结果。

摘要由CSDN通过智能技术生成

《语音信号处理试验教程》（梁瑞宇等）的代码主要是Matlab实现的，现在Python比较热门，所以把这个项目大部分内容写成了Python实现，大部分是手动写的。使用CSDN博客查看帮助文件：

Python语音基础操作–2.1语音录制，播放，读取
 Python语音基础操作–2.2语音编辑
 Python语音基础操作–2.3声强与响度
 Python语音基础操作–2.4语音信号生成
 Python语音基础操作–3.1语音分帧与加窗
 Python语音基础操作–3.2短时时域分析
 Python语音基础操作–3.3短时频域分析
 Python语音基础操作–3.4倒谱分析与MFCC系数
 Python语音基础操作–4.1语音端点检测
 Python语音基础操作–4.2基音周期检测
 Python语音基础操作–4.3共振峰估计
 Python语音基础操作–5.1自适应滤波
 Python语音基础操作–5.2谱减法
 Python语音基础操作–5.4小波分解
 Python语音基础操作–6.1PCM编码
 Python语音基础操作–6.2LPC编码
 Python语音基础操作–6.3ADPCM编码
 Python语音基础操作–7.1帧合并
 Python语音基础操作–7.2LPC的语音合成
 Python语音基础操作–10.1基于动态时间规整(DTW)的孤立字语音识别试验
 Python语音基础操作–10.2隐马尔科夫模型的孤立字识别
 Python语音基础操作–11.1矢量量化(VQ)的说话人情感识别
 Python语音基础操作–11.2基于GMM的说话人识别模型
 Python语音基础操作–12.1基于KNN的情感识别
 Python语音基础操作–12.2基于神经网络的情感识别
 Python语音基础操作–12.3基于支持向量机SVM的语音情感识别
 Python语音基础操作–12.4基于LDA，PCA的语音情感识别

代码可在Github上下载：busyyang/python_sound_open

高斯混合模型(Gaussian Mixture Model, GMM)可以看做一种状态数为1的连续分布隐马尔科夫模型。一个 $M$ 阶混合高斯模型的概率密度函数是 $M$ 个高斯概率密度函数加权求和得到的:
$P(X|\lambda)=\sum_{i=1}^Mw_ib_i(X)$

其中 $X$ 是D维随机向量，为说话人识别算法提取的特征矢量， $w_i$ 是混合权重，满足 $\sum_{i=1}^Mw_i=1$ ,每个分布因子 $b_i(X_t)$ 是D维的联合高斯概率分布：
$b_i(X)=\frac{1}{(2\pi)^{D/2}|\sum_i|^{1/2}}\exp\{-\frac{1}{2}(X-\mu_i)^t(\sum)_i^{-1}(X-\mu_i)\}$

最低0.47元/天解锁文章

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sinat_18131557 CSDN认证博客专家 CSDN认证企业博客

码龄10年

80: 原创

12万+: 周排名

9900: 总排名

22万+: 访问

: 等级

3073: 积分

361: 粉丝

248: 获赞

264: 评论

1754: 收藏

私信

关注

热门文章

分类专栏

图像配准 6篇
语音信号 28篇
Linux 1篇
树莓派 2篇
机器学习 7篇
ECG 2篇
频域 1篇
Python 66篇
Matlab 4篇
小波 1篇
爬虫 12篇
C++ 10篇
markdown
深度学习 14篇
异步 1篇

最新评论

Python语音基础操作--2.1语音录制，播放，读取
m0_59122532: 最新的librosa库中的waveplot 已经改为 waveshow了，可视化的时候需要改一下子
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
sinat_18131557: 好长时间不搞这个了，也给不了什么建议......
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
事儿屁大王: 你好，请教一个问题，我检查了我的matlab，确实没有安装runtime，但是matlab安装目录下有runtime/glnxa64这个目录，里面包含了一些.so，如libmwmclmcrrt，这种情况下可以使用动态库么？因为我在这种情况下使用我生成的.so里的初始化函数时仿真直接停止了，如果我跳过使用这个初始化函数，直接对mxArray类型的变量进行create的，然后get其指针，发现指针为NULL
Python语音基础操作--2.1语音录制，播放，读取
m0_65470500: 博主想问一下编码后输出的code赋值给ss，那我想将ss的数据存储起来要储存什么格式的文件，因为我写的程序要将解码和编码分成两个终端实现，中间需要tcp传输
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
sinat_18131557: runtime是没有图形界面的，runtime安装好后是可以使用matlab的库里面的函数，通过其他语言进行调用。如果要执行.m代码，光安装runtime应该是不行的。

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。