文章目录
原理
1.加窗
2.分帧
一般而言语音处理的目的有两种:
一种是对语音信号进行分析,提取特征参数,用于后续处理;
提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等
另一种是加工语音信号,
例如在语音增强中对含噪语音进行背景噪声抑制,以获得相对“干净”的语音;在语音合成方中需要对分段语音进行拼接平滑,获得主观音质较高的合成语音,这方面的应用同样是建立在分析并提取语音信号信息的基础上的。总之,语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。
根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,
提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。
原理
不论是分析怎样的参数以及采用什么分析方法,在按帧进行语音分析、提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。
1.加窗
窗函数可以加在时域或频域上,更多的是加在时域上
常用的窗函数
1.矩形窗
w ( n ) = { 1 , 0 ⩽ n ⩽ N − 1 0 , 其 他 w(n)=\left\{\begin{array}{ll}{1,} & {0 \leqslant n \leqslant N-1} \\ {0,} & {其他}\end{array}\right.w(n)={1,0,0⩽n⩽N−1其他
2.汉明窗
w ( n ) = { 0.54 − 0.46 cos [ 2 π n / ( N − 1 ) ] , 0 ⩽ n ⩽ N 0 , 其他 w(n)=\left\{\begin{array}{ll}{0.54-0.46 \cos [2 \pi n /(N-1)],} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\right.w(n)={0.54−0.46cos[2πn/(N−1)],0,0⩽n⩽N其他
3.海宁窗
w ( n ) = { 0.5 ( 1 − cos [ 2 π n / ( N − 1 ) ] ) , 0 ⩽ n ⩽ N 0 , 其他 w(n)=\left\{\begin{array}{ll}{0.5(1-\cos [2 \pi n /(N-1)]),} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\r