学习笔记,会将学习到的关于MFCC新的内容都整合到此博客。
欢迎留言讨论,不断更新中......
00 MFCC总概
步骤
- 预加重
- 分帧
- 加窗
- 傅里叶变换
- 梅尔滤波器组
- 取log
- 离散余弦变换
- 动态特征计算
输入输出
- 输入:已经过ADC处理后的离散语音信号
- 输出:39维MFCC特征向量
01 预加重(Pre-Emphasis)
通常,在语谱图中,高频的信号成分较弱。为了让高频部分信息突出出来,通常在时域中将数字语音信号通过一个高通滤波器(high pass filter):
作用:
- 如上所述,加强高频信息
- 避免在傅里叶变换操作中出现数值问题
- 可能改善信噪比(SNR)
- 消除发声过程中声带和嘴