matlab语音信号处理程序代码,语音信号处理—MFCC特征提取(matlab代码)

MFCC 参数考虑了人耳的听觉特性,将频谱转化为基于梅尔频标的非线性频谱,然后转换到倒谱域上。由于充分考虑了人的听

觉特性,而且没有任何前提假设,MFCC 参数具有良好的识别性能和抗噪能力。

由于人类对于声音高低的的感知强度与该声音的频率的对数近似成正比,梅尔频率正是体现出了这种声音频率与人类感知声音高

低的对应关系。在梅尔频率域内,人对声音高低的感知程度是线性的,梅尔频率与语音频率的关系式如下:

f(mel)=2595*lg ( 1 + f / 700 )

主要过程有:

输入语音——预加重——分帧、加窗——FFT、|FFT|^2——mel滤波器组——ln( )、DCT——输出系数

(1).预加重:人说话时唇端辐射使高频能量丢失,预加重可以提升高频部分,使信号频谱变得平坦,利于分析。一般通过传递函数为的一阶高通滤波器来实现预加重,对应的差分方程为

0818b9ca8b590ca3270a3433284dd417.png。其中为 预加重系数,一般0.9<

0818b9ca8b590ca3270a3433284dd417.png<1.0。这里取0.98。

(2).分帧、加窗:由于发音器官的惯性运动,可认为语音在一小段时间(

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值