语音信号处理基础(七)——短时频域分析

本文介绍了短时傅里叶变换在语音分析处理中的应用,阐述了短时傅里叶变换的原理,包括其作为时间n和角频率w的函数的特性,并讨论了窗函数的选择对频谱分辨率和时间分辨率的影响。此外,还探讨了语谱图的表示方法和实现,强调了宽带和窄带语谱图在揭示语音特性方面的差异及其在实际应用中的价值。
摘要由CSDN通过智能技术生成

原理

1.短时傅里叶变换

短时傅里叶分析(Short Time Fourier Analysis,STFA)适用于分析缓慢时变信号的频谱分析,在语音分析处理中已经得到广泛应用。其方法是先将语音信号分帧,再将各帧进行傅里叶变换。每一帧语音信号可以被认为是从各个不同的平稳信号波形中截取出来的,各帧语音的短时频谱就是各个平稳信号波形频谱的近似。

由于语音信号是短时平稳的,因此可以对语音进行分帧处理,计算某一帧的傅里叶变换,这样得到的就是短时傅里叶变换。其定义为
X n ( e j ω ) = ∑ m = − ∞ ∞ x ( m ) w ( n − m ) e − j ω m X_{n}\left(\mathrm{e}^{\mathrm{j} \omega}\right)=\sum_{m=-\infty}^{\infty} x(m) w(n-m) \mathrm{e}^{-\mathrm{j} \omega m} Xn(ejω)=m=x(m)w(nm)ejωm
式中,x(n)为语音信号序列;w(n)为实数窗序列,n取不同值时,窗w(n-m)沿时间轴滑动到不同的位置,取出不同的语音帧进行傅里叶变换。
显然,短时傅里叶变换是时间n和角频率w的函数,它反映了语音信号的频谱随时间变化的特性.

在这里插入图片描述

短时傅里叶变换有两种不同的解释:

一种是当n固定不变,X,(e)为序列w(n一m)x(m)(-∞<m<∞)的标准傅里叶变换,此时X,(ejw)具有与标准傅里叶变换相同的性质;

另一种是当w固定不变,可以将Xn(ejw)视为信号x(n)与窗函数指数加权w(n)e(jwn)的卷积,此时可以把短时傅里叶变换看做线性滤波
X n ( e i ω ) = ∑ m = − ∞ ∞ w ( m ) x ( n − m ) e − j ω ( n − m ) = e − j ω n [ [ w ( n ) e j ω

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值