I、预备知识:
1)帧:简单说,有一段语音信号,分成很小的一段一段的等长的信号,这其中一段就是一帧。—通常一秒取约33帧到100帧,也就是说一帧大约时长为1s/100-1s/33。(如下图为一段语音数字信号)
2)信号预处理:
a. 在对一段语音数字信号进行预加重数字滤波处理后,紧接着需要将信号分成一帧一帧,为了保证帧与帧之间平滑过渡,往往允许帧与帧之间有重合,(如下图所示)
b. 分帧就会导致频谱泄露的问题,为了应对这些问题,大牛老师们提出了使用窗口函数进行分帧(也称之为截断),好了,终于绕到窗口函数了,说到窗口函数,那就很多了,汉明窗就是一个典型的例子。
c. 有了窗口函数,就可愉快地对信号进行分帧处理了,新的信号可以用右边这个公式表示了:S(n) = s(n)*w(n)
3)余弦函数:y = cos(x),(如下图)
II、汉明窗–公式如下
III、原理
其原理可以说就是通过余弦函数的特性得到的,举个栗子,以下是原始信号经过加窗处理的之后结果:
—观察余弦函数,是不是能看出点什么来?嗯,就是这个道理。
参考资料:
[1]. 基于嵌入式的关键词组识别系统的设计与实现
[2].矩形窗和汉明窗分辨率说明 --百度文库
[3].窗函数 --百度百科
[4]. 短时傅里叶变换及其应用 --百度文库