梅尔倒谱分析MFCC

梅尔倒谱系数(MFCC)是一种基于人类听觉特性的语音分析方法,用于模拟人耳对声音频率的感知。预处理包括预加重、分帧加窗和FFT转换。接着,通过梅尔滤波器组进行滤波,将频率转换到梅尔尺度,并取对数以符合人耳对声音强度的感知。通常,会使用24个梅尔滤波器,输出为24维特征向量。MFCC广泛应用于语音识别、情感分析等领域。
摘要由CSDN通过智能技术生成

梅尔倒谱系数

MFCC

梅尔频率倒谱系数的分析是基于人的听觉特性机理,即根据人的听觉实验结果来分析语音的频谱。因为人耳所能听到的声音高低与声音的频率并不成线性正比关系,所以用mel频率尺度更符合人耳的听觉特性。
在这里插入图片描述
预加重部分用一个一阶高通滤波器,目的是为了补偿高频分量的损失,提升高频分量。滤波器常设为:
在这里插入图片描述
分帧:把每一帧信号当作稳定信号来处理。

加窗:减少频谱泄漏。

FFT:把时域转化为频域,计算谱线能量。

mel滤波:

MEL滤波器滤波:

梅尔频率尺度和实际频率的对应关系
在这里插入图片描述
在这里插入图片描述
美尔滤波器的传递函数
在这里插入图片描述
在梅尔频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值