Python语音基础操作--11.1矢量量化(VQ)的说话人情感识别

最新推荐文章于 2024-03-18 16:22:11 发布

sinat_18131557

最新推荐文章于 2024-03-18 16:22:11 发布

阅读量1.8k

点赞数

分类专栏： Python 语音信号文章标签： python 语音识别机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_18131557/article/details/106440998

版权

《语音信号处理试验教程》（梁瑞宇等）的代码主要是Matlab实现的，现在Python比较热门，所以把这个项目大部分内容写成了Python实现，大部分是手动写的。使用CSDN博客查看帮助文件：

Python语音基础操作–2.1语音录制，播放，读取
 Python语音基础操作–2.2语音编辑
 Python语音基础操作–2.3声强与响度
 Python语音基础操作–2.4语音信号生成
 Python语音基础操作–3.1语音分帧与加窗
 Python语音基础操作–3.2短时时域分析
 Python语音基础操作–3.3短时频域分析
 Python语音基础操作–3.4倒谱分析与MFCC系数
 Python语音基础操作–4.1语音端点检测
 Python语音基础操作–4.2基音周期检测
 Python语音基础操作–4.3共振峰估计
 Python语音基础操作–5.1自适应滤波
 Python语音基础操作–5.2谱减法
 Python语音基础操作–5.4小波分解
 Python语音基础操作–6.1PCM编码
 Python语音基础操作–6.2LPC编码
 Python语音基础操作–6.3ADPCM编码
 Python语音基础操作–7.1帧合并
 Python语音基础操作–7.2LPC的语音合成
 Python语音基础操作–10.1基于动态时间规整(DTW)的孤立字语音识别试验
 Python语音基础操作–10.2隐马尔科夫模型的孤立字识别
 Python语音基础操作–11.1矢量量化(VQ)的说话人情感识别
 Python语音基础操作–11.2基于GMM的说话人识别模型
 Python语音基础操作–12.1基于KNN的情感识别
 Python语音基础操作–12.2基于神经网络的情感识别
 Python语音基础操作–12.3基于支持向量机SVM的语音情感识别
 Python语音基础操作–12.4基于LDA，PCA的语音情感识别

代码可在Github上下载：busyyang/python_sound_open

VQ基本原理

矢量量化(VQ)的基本原理是将若干个标量数据组成一个矢量（或者从一帧语音数据中提取的特征矢量）在多维空间给予整体量化，从而可以在信息量损失最小的情况下压缩数据量。假设有N个K维的特征向量 $X=\{X_1,X_2,...,X_N\}$ ,( $X$ 在K维欧几里得空间 $R^K$ 中)，其中第i个矢量可写为：
$X_i=\{x_1,x_2,...,x_K\},i=1,2,...,N$

将K维欧几里得空间无遗漏地划分成 $J$ 个互不相关的子空间 $R_1,R_2,...,R_J$ ,有：
$\left\{\begin{array}{ll} \bigcup_{j=1}^JR_j=R^K\\R_i\bigcap R_j=\Phi,i\neq j \end{array}\right.$

这些子空间 $R_j$ 称为胞腔，在每个子空间 $R_j$ 找一个代表向量 $Y_j$ ，那么有J个代表矢量可以组成矢量集： $Y=\{Y_1,Y_2,...,Y_J\}$

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
Python语音基础操作--11.1矢量量化(VQ)的说话人情感识别

VQ基本原理矢量量化(VQ)的基本原理是将若干个标量数据组成一个矢量（或者从一帧语音数据中提取的特征矢量）在多维空间给予整体量化，从而可以在信息量损失最小的情况下压缩数据量。假设有N个K维的特征向量X={X1,X2,...,XN}X=\{X_1,X_2,...,X_N\}X={X1,X2,...,XN},(XXX在K维欧几里得空间RKR^KRK中)，其中第i个矢量可写为：Xi={x1,x2,...,xK},i=1,2,...,NX_i=\{x_1,x_2,...,x_K\},i=1,2,...,N
复制链接

扫一扫

专栏目录

sinat_18131557 CSDN认证博客专家 CSDN认证企业博客

码龄10年

79: 原创

22万+: 周排名

112万+: 总排名

22万+: 访问

: 等级

3038: 积分

359: 粉丝

244: 获赞

264: 评论

1741: 收藏

私信

关注

热门文章

分类专栏

图像配准 5篇
语音信号 28篇
Linux 1篇
树莓派 2篇
机器学习 7篇
ECG 2篇
频域 1篇
Python 66篇
Matlab 4篇
小波 1篇
爬虫 12篇
C++ 9篇
markdown
深度学习 14篇
异步 1篇

最新评论

matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
sinat_18131557: 好长时间不搞这个了，也给不了什么建议......
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
事儿屁大王: 你好，请教一个问题，我检查了我的matlab，确实没有安装runtime，但是matlab安装目录下有runtime/glnxa64这个目录，里面包含了一些.so，如libmwmclmcrrt，这种情况下可以使用动态库么？因为我在这种情况下使用我生成的.so里的初始化函数时仿真直接停止了，如果我跳过使用这个初始化函数，直接对mxArray类型的变量进行create的，然后get其指针，发现指针为NULL
Python语音基础操作--2.1语音录制，播放，读取
m0_65470500: 博主想问一下编码后输出的code赋值给ss，那我想将ss的数据存储起来要储存什么格式的文件，因为我写的程序要将解码和编码分成两个终端实现，中间需要tcp传输
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
sinat_18131557: runtime是没有图形界面的，runtime安装好后是可以使用matlab的库里面的函数，通过其他语言进行调用。如果要执行.m代码，光安装runtime应该是不行的。
matlab与C/C++混合编程——在Windows/Linux上调用Matlab编译的动态库文件
Istmiregal: 您好，请问linux上安装matlabruntime完成后怎么运行呢？或者说怎么开matlab的图形界面？我的软件界面里没有，然后在matlabruntime安装目录下也没有可以运行的地方，直接用matlab命令会报错

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。