MATLAB2018a及以后版本都内嵌了mfcc这个语音特征提取包,使用也是十分方便。
mfcc(y,FS,'WindowLength',1024,'OverlapLength',900, 'NumCoeffs',13,'FFTLength',1024,'LogEnergy', 'Append');
最关心的是:
帧长度:WindowLength,默认是FS*0.03
重叠长度:OverlapLength,默认是FS*0.02
系数个数:NumCoeffs,默认是13
傅里叶变换长度:FFTLength,默认是帧长度
帧能量:LogEnergy,也就是该帧所有元素的平方和求log,e为底。参数有三个模式“Append”、‘Repalce’、'Ignore',也就是如何处理这个帧能量序列,它是衡量该帧语音能量大小的。
下面是官网对mfcc的更详细解释:
https://www.mathworks.com/help/audio/ref/mfcc.html