java mfcc_MFCC可视化

最新推荐文章于 2024-08-27 22:40:22 发布

weixin_39651816

最新推荐文章于 2024-08-27 22:40:22 发布

阅读量163

点赞数

文章标签： java mfcc

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39651816/article/details/114200471

版权

大多数文章和博客介绍都是MFCC的算法流程，物理意义，这里仅仅从数据分布可视化的角度，清晰

观察MFCC特征在空间中的分布情况，加深理解。

MFCC处理流程：

MFCC参数的提取包括以下几个步骤：

1.预滤波：CODEC前端带宽为300-3400Hz的抗混叠滤波器。

2.A/D变换：8kHz的采样频率，12bit的线性量化精度。

3.预加重：通过一个一阶有限激励响应高通滤波器，使信号的频谱变得平坦，不易受到有限字长效应的影响。

4.分帧：根据语音的短时平稳特性，语音可以以帧为单位进行处理，实验中选取的语音帧长为32ms，帧叠为16ms。

5.加窗：采用哈明窗对一帧语音加窗，以减小吉布斯效应的影响。

6.快速傅立叶变换(Fast Fourier Transformation, FFT)：将时域信号变换成为信号的功率谱。

7.三角窗滤波：用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器)，对信号的功率谱滤波，每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽，以此来模拟人耳的掩蔽效应。

8.求对数：三角窗滤波器组的输出求取对数，可以得到近似于同态变换的结果。

9.离散余弦变换(Discrete Cosine Transformation, DCT)：去除各维信号之间的相关性，将信号映射到低维空间。

10.谱加权：由于倒谱的低阶参数易受说话人特性、信道特性等的影响，而高阶参数的分辨能力比较低，所以需要进行谱加权，抑制其低阶和高阶参数。

11. 倒谱均值减(Cepstrum Mean Subtraction, CMS)：CMS可以有效地减小语音输入信道对特征参数的影响。

12.差分参数：大量实验表明，在语音特征中加入表征语音动态特性的差分参数，能够提高系统的识别性能。在本系统中，我们也用到了MFCC参数的一阶差分参数和二阶差分参数。

13.短时能量：语音的短时能量也是重要的特征参数，本系统中我们采用了语音的短时归一化对数能量及其一阶差分、二阶差分参数。

图形可视化：

weixin_39651816

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。