宽带语谱图(wideband spectrogram)和窄带语谱图(narrowband spectrogram)的区别

1.概念区分

宽带spectrogram: 以3ms(或300Hz左右的带宽)左右进行分帧之后制成的spectrogram

窄带spectrogram: 以20ms(或45Hz左右的带宽)左右进行分帧之后制成的spectrogram

首先3ms和20ms大家都理解,就是每一帧持续的时间分别是3ms和20ms,但是后面对应的带宽是啥意思呢?

原来,所谓的分帧,相当于加了一个矩形窗函数,而加窗也就是信号和窗函数相乘,在频域中对应的是窗函数和原信号的频谱进行卷积。

矩形窗的傅里叶变换大家应该很熟悉了:

G_\tau(t) \leftrightarrow \tau Sa(\omega\tau/2) = \tau Sa(\pi f\tau)

其中τ为窗函数的长度,G_τ(t)代表一个关于原点对称且长度为τ的窗函数,Sa(t)=sint/t 是抽样函数。其幅频相应的带宽(即对应幅值1/根号2)约为0.88/τ。

对于τ=3 ms , 对应带宽为293Hz,

对于τ=20 ms ,对应带宽为44Hz. 

这两个数字正好对应上文提到的两个带宽。这下理解为啥3ms的短窗叫宽带语谱图,而20ms的长窗叫窄带语谱图了吧

2.性质区别

一般来说,这两种语谱图有其对应用途,宽带语谱图可以清晰的看到语音信息的共振峰频率,但是看不到谐波频率,反之,窄带语谱图可以看到谐波频率,但是看不到共振峰的频率。为什么会造成这样的区别?

宽带语谱图因为每一帧时间很短,所以可以捕捉到较快的振幅变化,也因此,宽带语谱图上可以看到一条条垂直线条,对应了振幅上的快速变化,在时间域上来看,在共振峰频率处,会出现连续深色,和周围形成明显的区别。下图是一个宽带语谱图,大家可以很明显的看出垂直线条,而那些颜色明显深于上下区域的部分则对应了共振峰频率。

而对于窄带语谱图,与宽带语谱图不同,由于每一帧时间太长,难以捕捉振幅的快速变化,也就难以看出共振峰的位置,但是可以看出谐波的位置,如下图,大家可以明显的看出一条条水平线条,而且间隔一致,这些就是谐波(harmonics)。

除此之外,宽带语谱图由于窗短,因此时间分辨率高(因为帧数多了)但是频率分辨率低(因为每一帧对应的sample数少了,做FFT自然频率分辨率下降),而窄带语谱图则由于窗长,时间分辨率低但频率分辨率高。

  • 8
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值