梅尔倒谱系数特征(Mel-frequency cepstral coefficients,MFCC)

引言

感知实验表明,人耳对于声音信号的感知聚焦于某一特定频率区域内,而非在整个频谱包络中。

MFCC特征是应用非常广泛的语音特征。

语音的MFCC特征是基于人耳感知实验得到,将人耳当成特定的滤波器,只考虑某些特定频率成分。这些滤波器是在频域上不均匀分布的。更多的滤波器聚集于低频部分,高频部分的滤波器较少。采样率16Khz时,下图实例:

MFCC计算及其意义

MFCC是一种倒谱特征,计算意义见下图:

其中,对于声音信号,一般会进行分帧后再提取特征,利用不同的窗函数实现。

MFCC可以描述为:【Spectrum → Mel-Filters → Mel-Spectrum】

先计算当前帧数据的频谱(FFT)得到短时谱,再经过MEL滤波器滤波,输出对数MEL能量谱,经过DCT去相关,得到MFCC系数(此时特征维数由DCT系数数目决定)。

其中,经过对数操作之后,有同态信号处理的意思。

经过特征提取,语音信号可以通过一系列的倒谱向量表示。

转载于:https://www.cnblogs.com/ytxwzqin/p/10717978.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值