实验目的
1、熟练运用MATLAB软件进行语音信号实验;
2、熟悉短时分析原理、MFCC的原理;
3、学习运用MATLAB编程进行MFCC的提取;
4、学会利用短时分析原理提取MFCC特征序列;
实验原理
MFCC:
语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel频率可以用如下公式表示:
在实际应用中,MFCC倒谱系数计算过程如下;
① 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。
② 求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠
加,这时第k个滤波器输出功率谱)('
kx。
③ 将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L个MFCC系数,一般L取12~16个左右。MFCC系数为
实验过程(步骤)
① 输入样本音频
② 给样本音频预加重、分帧、加窗
③ 将处理好的样本音频做傅里叶变换
④ 进行Mel频率滤波
⑤ 进行Log对数能量
⑥ 对样本求倒谱
⑦ 输出MFCC图像