matlab语音信号处理程序代码,语音信号处理—MFCC特征提取(matlab代码)

最新推荐文章于 2023-02-27 19:18:37 发布

苏额

最新推荐文章于 2023-02-27 19:18:37 发布

阅读量1.5k

点赞数

文章标签： matlab语音信号处理程序代码

本文介绍了MFCC（梅尔频率倒谱系数）的语音信号处理原理，包括预加重、分帧加窗、FFT、梅尔滤波器组、对数运算和DCT等步骤。提供两个MATLAB代码示例，用于提取MFCC特征和一阶差分MFCC参数。

摘要由CSDN通过智能技术生成

MFCC 参数考虑了人耳的听觉特性，将频谱转化为基于梅尔频标的非线性频谱，然后转换到倒谱域上。由于充分考虑了人的听

觉特性，而且没有任何前提假设，MFCC 参数具有良好的识别性能和抗噪能力。

由于人类对于声音高低的的感知强度与该声音的频率的对数近似成正比，梅尔频率正是体现出了这种声音频率与人类感知声音高

低的对应关系。在梅尔频率域内，人对声音高低的感知程度是线性的，梅尔频率与语音频率的关系式如下：

f(mel)=2595*lg ( 1 + f / 700 )

主要过程有：

输入语音——预加重——分帧、加窗——FFT、|FFT|^2——mel滤波器组——ln( )、DCT——输出系数

(1).预加重：人说话时唇端辐射使高频能量丢失，预加重可以提升高频部分，使信号频谱变得平坦，利于分析。一般通过传递函数为的一阶高通滤波器来实现预加重，对应的差分方程为

。其中为预加重系数，一般0.9<

<1.0。这里取0.98。

(2).分帧、加窗：由于发音器官的惯性运动，可认为语音在一小段时间(10

最低0.47元/天解锁文章

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。