1.分帧,每一帧中有固定N个离散信号。帧之间有重叠。
2.加窗。(提高单帧信号的连续性)
3.short -FFT(短时快速傅里叶变换),得到频谱图
注:频谱(spectrum)表示的是频率与能量之间的关系,常用的频谱有线性频谱、对数频谱(log计算,单位为分贝),自功率谱等等。
4.得到“声谱图”(spectro-gram),过程如下:
5.求倒谱图
下面解释为什么要做“倒频谱”:
求频谱其实就是重点关注频率与能量之间的关系,细节不关心,所以我们只想要频谱包络(红线部分。)发现对频谱做了逆FFT之后,包络信息集中在低频区域,用一个低通滤波器就可以得到了,非常方便。
因为人耳对频率响应的特性是对低频敏感,对高频不敏感,所以用滤波器组让f ->mel f 。
这样,整体的思路就是:分帧 —> 加窗 —> FFT ----> 频谱通过Mel滤波器组得到Mel频谱 ----> 求倒频谱
音频信号的处理
最新推荐文章于 2023-11-24 10:38:23 发布