文章目录
原理
1.短时傅里叶变换
短时傅里叶分析(Short Time Fourier Analysis,STFA)适用于分析缓慢时变信号的频谱分析,在语音分析处理中已经得到广泛应用。其方法是先将语音信号分帧,再将各帧进行傅里叶变换。每一帧语音信号可以被认为是从各个不同的平稳信号波形中截取出来的,各帧语音的短时频谱就是各个平稳信号波形频谱的近似。
由于语音信号是短时平稳的,因此可以对语音进行分帧处理,计算某一帧的傅里叶变换,这样得到的就是短时傅里叶变换。其定义为
X n ( e j ω ) = ∑ m = − ∞ ∞ x ( m ) w ( n − m ) e − j ω m X_{n}\left(\mathrm{e}^{\mathrm{j} \omega}\right)=\sum_{m=-\infty}^{\infty} x(m) w(n-m) \mathrm{e}^{-\mathrm{j} \omega m} Xn(ejω)=m=−∞∑∞x(m)w(n−m)e−jωm
式中,x(n)为语音信号序列;w(n)为实数窗序列,n取不同值时,窗w(n-m)沿时间轴滑动到不同的位置,取出不同的语音帧进行傅里叶变换。
显然,短时傅里叶变换是时间n和角频率w的函数,它反映了语音信号的频谱随时间变化的特性.
短时傅里叶变换有两种不同的解释:
一种是当n固定不变,X,(e)为序列w(n一m)x(m)(-∞<m<∞)的标准傅里叶变换,此时X,(ejw)具有与标准傅里叶变换相同的性质;
另一种是当w固定不变,可以将Xn(ejw)视为信号x(n)与窗函数指数加权w(n)e(jwn)的卷积,此时可以把短时傅里叶变换看做线性滤波
X n ( e i ω ) = ∑ m = − ∞ ∞ w ( m ) x ( n − m ) e − j ω ( n − m ) = e − j ω n [ [ w ( n ) e j ω