小波教程-part2-傅立叶变换和短时傅立叶变换

1. 基本原理

让我们简要回顾一下第一部分。 我们基本上需要小波变换(WT)来分析非平稳信号,即其频率响应随时间变化的信号。 我已经写过傅立叶变换(FT)不适合非平稳信号,并且已经展示了一些例子以使其更加清晰。 快速回顾一下,让我举一个例子。 假设我们有两个不同的信号。 还假设它们都具有相同的光谱成分,但有一个主要区别。 假设其中一个信号始终具有四个频率分量,另一个信号在不同时间具有相同的四个频率分量。 如本教程第1部分中的示例所示,这两个信号的FT相同。 尽管两个信号完全不同,但它们的FT的(幅度)是一样的!。 显然,这告诉我们不能将FT用于非平稳信号。

2. 傅立叶变换

由于以下两个原因,我不会详细介绍FT:

(1)详细介绍FT会使这个教程显得太多了。
(2)而且FT不是我们的主要关注点。

但是,由于两个原因,我想再次提到几个要点:

(1)了解WT的工作原理是必要的背景。
(2)多年来,它一直是最重要的信号处理工具。

现在让我们看一下傅立叶变换的工作原理:
FT将信号分解为不同频率的复杂指数函数。 它的执行方式由以下两个方程式定义:

X ( f ) = ∫ − ∞ ∞ x ( t ) ⋅ e − 2 j π f t d t X(f) = \int_{-\infty}^{\infty} x(t) \cdot e^{-2 j \pi f t} dt X(f)=x(t)e2jπftdt··········································(1)

x ( t ) = ∫ − ∞ ∞ X ( f ) ⋅ e 2 j π f t d f x(t) = \int_{-\infty}^{\infty} X(f) \cdot e^{2 j \pi f t} df x(t)=X(f)e2jπftdf···········································(2)

在上式中, t t t代表时间, f f f代表频率, x x x代表信号。 注意, x x x表示时域的信号, X X X表示频域的信号。 此约定用于区分信号的两种表示形式。 式(1)称为 x ( t ) x(t) x(t)的傅立叶变换,式(2)称为 X ( f ) X(f) X(f)的傅立叶逆变换,即 x ( t ) x(t) x(t)

对于那些一直在使用傅立叶变换的人来说,已经很熟悉了。 不幸的是,许多人在不了解基本原理的情况下使用这些方程式。

请仔细看等式(1):

信号 x ( t ) x(t) x(t)在某个特定频率“ f f f”处乘以指数项,然后在所有时间积分! (这里的关键词是“所有时间”,如下所述)。

请注意,等式(1)中的指数项也可以根据欧拉公式写成:

c o s ( 2 π f t ) − i ⋅ s i n ( 2 π f t ) cos(2 \pi f t)-i \cdot sin(2 \pi f t) cos(2πft)isin(2πft)

上面的表达式具有频率 f f f的余弦的实部和频率 f f f的正弦的虚部。 因此,我们实际要做的是将原始信号乘以具有频率 f f f的正弦和余弦的复数表达式。 然后,我们集成该乘积。 换句话说,我们将所有积分添加到该乘积中。 如果这种积分的结果(除了某种无穷求和之外)是一个很大的值,那么我们 说:信号 x ( t ) x(t) x(t)在频率“ f f f”处具有占主导地位的频谱分量。 这意味着该信号的主要部分由频率 f f f 成。 如果积分结果是一个较小的值,则表示信号中没有 f f f的主要频率分量。 如果该积 分结果为零,则该信号根本不包含频率“ f f f”。

在此特别感兴趣的是了解这种积分的工作原理:将信号与频率“ f f f”的正弦项相乘。 如果信号具有频率“ f f f”的高幅度分量,则该分量和正弦项将重合,并且它们的乘积将给出(相对)大的值。 这表明,信号“ x x x”具有主要频率分量“ f f f”。

但是,如果信号的频率分量不为“ f f f”,则乘积将为零,这表明信号的频率分量不为“ f f f”。 如果频率“ f f f”不是信号“ x ( t ) x(t) x(t)”的主要成分,则乘积将给出一个(相对)小的值。 这表明,信号“ x x x”中的频率分量“ f f f”具有小的幅度,换言之,它不是“ x x x”的主要分量。

现在,请注意,转换方程式(公式1)中的积分随时间而变化。 但是,(1)的左侧是频率的函数。 因此,针对每个 f f f值计算(1)中的积分

注意,傅立叶变换表明是否存在某个频率分量。 此信息与该组件的显示时间无关。 因此,在使用FT处理信号之前,了解信号是否平稳非常重要。

第一部分给出的示例现在应该很清楚。 我想再次在这里把它放出来:

看下图,该图显示了信号:

x ( t ) = c o s ( 2 π ⋅ 5 t ) + c o s ( 2 π ⋅ 10 t ) + c o s ( 2 π ⋅ 20 t ) + c o s ( 2 π ⋅ 50 t ) x(t) = cos(2 \pi \cdot 5 t) + cos(2 \pi \cdot 10 t) + cos(2 \pi \cdot 20 t) + cos(2 \pi \cdot 50 t) x(t)=cos(2π5t)+cos(2π10t)+cos(2π20t)+cos(2π50t)

也就是说,它具有5 Hz,10 Hz,20 Hz和50 Hz的四个频率分量,它们分布于每个时间点。

在这里插入图片描述
这是它的FT。 此处截取了一部分频率轴,但理论上它会扩展到无穷大(对于连续傅立叶变换(CFT)。实际上,我们在这里计算离散傅立叶变换(DFT)),在这种情况下,在这种情况下,频率轴上升到(至少)信号采样频率的两倍,并且变换后的信号是对称的。但是,这并不重要。)

在这里插入图片描述注意上图中的四个峰值,它们对应于四个不同的频率。

现在,看下图:在这里,该信号还是余弦信号,并且具有相同的四个频率。 但是,这些频率在不同的时间出现。

在这里插入图片描述
这是信号的傅立叶变换:
在这里插入图片描述你应该在上图中看到的是,它(几乎)与之前的FT图相同。 请仔细查看并注意对应于5、10、20和50 Hz的主要四个峰值。 我本可以使这个数字看起来与上一个非常相似,但是我并不是故意这样做的。 峰值之间存在类似噪声的原因表明,这些频率也存在于信号中。 但是它们之所以具有较小的幅度,是因为它们不是给定信号的主要频谱分量,而我们看到这些分量的原因是由于频率之间的突然变化。 尤其要注意时域信号如何在约250(ms)的时间变化(通过一些适当的滤波技术,可以清除像频域信号一样的噪声,但这与我们的主题无关。如果您需要进一步 信息,请给我发送电子邮件)。

到此时,您应该已经了解了傅立叶变换的基本概念,何时可以使用傅立叶变换,何时不可以使用傅立叶变换。 从上面的示例可以看出,FT无法很好地区分这两个信号。 对于FT,这两个信号是相同的,因为它们由相同的频率分量组成。 因此,FT不适用于分析非平稳信号。

请记住这一非常重要的属性。 不幸的是,许多使用FT的人没有想到这一点。 他们认为他们拥有的信号是固定的,而在许多实际情况下却不是。 当然,如果您对这些频率分量在什么时间不感兴趣,而仅对存在哪些频率分量感兴趣,那么FT可以作为一种合适的工具来使用。

因此,既然我们知道不能将FT用于非平稳信号,那么我们该怎么办?

请记住,我已经提到过小波变换仅使用了大约十年(作者很久以前写的)。 您可能想知道研究人员是否仅在十年前就注意到了这种非平稳性问题。

很明显不是。

显然,他们在弄清楚小波变换之前一定已经做了一些事情。

好吧…,他们确实做到了…

他们想出了…

线性时间频率表示

3. 短时傅立叶变换

那么,我们如何将这个时间信息插入到频率图中? 让我们更仔细地研究手中的问题。

傅立叶变换出什么问题了呢? 它不适用于非平稳信号。 让我们考虑一下:我们是否可以假设非平稳信号的某些部分是平稳的呢?

答案是肯定的。

请看上面的Figure2.4。 每250个时间单位间隔信号保持平稳。

您可能会问以下问题?

如果我们可以认为平稳的部分很小怎么办?

好吧,如果它太小,那就太小了。 我们对此无能为力,实际上,这也没有错。 我们必须按照物理学家的规则进行游戏。

如果可以假设信号处于静止状态的区域太小,则我们从狭窄的窗口中查看该信号,该窗口足够窄以至于从这些窗口看到的信号部分的确是平稳的。

对这种方法的研究最终产生了傅立叶变换的修订版,即所谓的:短时傅立叶变换(STFT)

STFT和FT之间只有很小的差异。 在STFT中,信号被分成足够小的段,在这些段中,可以假定信号的这些段(部分)是平稳的。 为此,选择窗口函数“ w w w”。 该窗口的宽度必须等于其平稳性有效的信号段。

该窗口函数首先位于信号的最开始。 即,窗函数位于t = 0。 假设窗口的宽度为“ T”秒。 在此时间点(t = 0),窗口函数将与前T / 2秒重叠(我将假定所有时间单位均为秒)。 然后将窗口函数与信号相乘。 这样,只有窗口的适当权重才选择了信号的前T / 2秒(如果窗口是一个矩形,幅度为“ 1”,则乘积将等于信号)。 然后,假定该乘积只是要获取其FT的另一个信号。 换句话说,该乘积的FT值与任何信号的FT值一样。

这种转换的结果是信号的前T / 2秒的FT。 如果信号的这部分是固定的(如假定的那样),那么将没有问题,并且获得的结果将是信号的前T / 2秒的真实频率表示。

下一步是将这个窗口(持续约t1秒钟)移至新位置,与信号相乘,然后乘积FT。 遵循此过程,直到通过以“ t1”秒的间隔移动窗口来达到信号的结尾。

STFT的以下定义在一行中总结了所有上述解释:

S T F T X ( ω ) ( t , f ) = ∫ t [ x ( t ) ⋅ ω ∗ ( t − t ′ ) ] ⋅ e − j 2 π f t d t STFT_X^{(\omega)}(t,f) = \int_t \left[ x(t) \cdot \omega^*(t - t') \right] \cdot e^{-j 2 \pi f t} dt STFTX(ω)(t,f)=t[x(t)ω(tt)]ej2πftdt

请仔细查看以上方程。 x ( t ) x(t) x(t)是信号本身, w ( t ) w(t) w(t)是窗函数, ∗ * 是复合共轭。 从等式中可以看出,信号的STFT就是信号的FT乘以窗函数,而且这里的积分是有限时间的积分,这样才能挖掘出时间信息。

对于每个 t ′ t' t f f f,都会计算出一个新的STFT系数。

下图可以帮助您更好地理解这一点:
在这里插入图片描述
窗口函数是彩色的类似于高斯函数。 红色的显示窗口位于t = t1’,蓝色的显示窗口t = t2’,绿色的显示窗口位于t = t3’。 这些将在三个不同的时间对应于三个不同的FT。 因此,我们将获得信号的真实时频表示(TFR)。

可能最好的理解方法是看一个例子。 首先,由于我们的变换是时间和频率的函数(与FT不同,后者仅是频率的函数),因此变换将是二维的(如果也计算幅度,则为3)。 让我们以一个非平稳信号为例,如下所示:

在这里插入图片描述在此信号中,在不同时间有四个频率分量。 0到250 ms的间隔是300 Hz的简单正弦曲线,其他250 ms的间隔分别是200 Hz,100 Hz和50 Hz的正弦曲线。 显然,这是一个非平稳信号。 现在,让我们看一下它的STFT:
在这里插入图片描述不出所料,这是二维图(如果也算振幅,则为3维)。 “ x”和“ y”轴分别是时间和频率。 请忽略轴上的数字,因为它们已在某些方面进行了归一化,这对我们而言目前没有任何意义。 只需检查时频表示的形状即可。

首先,请注意,该图形相对于频率轴的中线是对称的。 请记住,尽管未显示,但实际信号的FT始终是对称的,因为STFT只是FT的窗口形式,所以STFT在频率上也是对称的也就不足为奇了。 对称部分据说与负频率相关,这是一个很难理解的奇特概念,幸运的是,它并不重要。 只需知道STFT和FT是对称的即可。

重要的是四个峰值。 注意,有四个峰值对应于四个不同的频率分量。 还应注意,与FT不同,这四个峰沿时间轴位于不同的时间间隔。 请记住,原始信号在不同时间具有四个频谱分量。

现在我们有了信号的真实时频表示。 我们不仅知道信号中存在哪些频率分量,还知道它们在时间上的位置。

您可能会奇怪,因为STFT给出了信号的TFR,所以为什么需要小波变换。 在上面的示例中,STFT的隐式问题并不明显。 当然,故意选择一个效果很好的示例来演示该概念。

STFT的问题在于其根源可以追溯到海森堡不确定性原理这一事实。 最初应用于运动粒子的动量和位置的这一原理可以应用于信号的时频信息。 简而言之,这一原理指出,人们不知道信号的确切时频表示,即,人们不知道在什么时间实例存在什么频谱分量。 人们可以知道存在一定频带的时间间隔,这是一个分辨率问题。

STFT的问题与所使用的窗口函数的宽度有关。 为了技术上正确,窗口功能的这种宽度称为窗口的支持。 如果窗口函数较窄,则称为紧凑支持。 这个术语在小波世界中更常用,我们将在后面看到。

回想一下,在FT中,在频域中没有分辨率问题,即我们确切知道存在哪些频率; 同样,在时域中也没有时间分辨率问题,因为我们知道每个时刻的信号值。 相反,FT中的时间分辨率和时域中的频率分辨率为零,因为我们没有关于它们的信息。 在FT中提供理想的频率分辨率的事实是,FT中使用的窗口是其内核,即 e j ω t e ^ {j \omega t} ejωt函数,该函数在从负无穷大到正无穷大的所有时间一直存在。 现在,在STFT中,我们的窗口是有限长度的,因此它仅覆盖一部分信号,这导致频率分辨率变差。 简而言之,我们不再知道信号中存在的确切频率成分,而只知道存在的一个频带:

在FT中,核函数使我们可以获得完美的频率分辨率,因为内核本身是无限长的窗口。 在STFT中,窗口的长度是有限的,我们不再具有完美的频率分辨率。 您可能会问,为什么不像FT中那样使STFT中的窗口长度无限长,以获得完美的频率分辨率? 好吧,比起您一直散布所有时间信息,您基本上最终会使用FT而不是STFT。 长话短说,我们面临以下困境:

如果使用无限长的窗口,则会得到FT,该FT可以提供理想的频率分辨率,但没有时间信息。 此外,为了获得平稳性,我们必须具有足够短的窗口,其中信号是固定的。 我们使窗口越窄,时间分辨率越好,平稳性的假设越好,但频率分辨率越差:

窄窗口===>时间分辨率好,频率分辨率差。
(注:个人理解是因为窗口过窄会遗漏一些低频信号,因为窗口比低频信号的周期都要窄)

宽窗口===>良好的频率分辨率,较差的时间分辨率。
(注:个人理解是比如窗口为一个小时,那么50到60分钟时都信号都包含哪些频率就不得而知了)

为了看到这些效果,让我们看几个示例:我将显示四个不同长度的窗口,我们将使用它们来计算STFT,然后看看会发生什么:

我们使用的窗口函数只是形式为下面这样的高斯函数:

e − a ( t 2 2 ) e^{-a \left( \frac{t^2}{2} \right)} ea(2t2)

其中a确定窗口的长度,t是时间。 下图显示了由a的值确定的不同支撑区域的四个窗口函数。 请忽略a的数值,因为计算此函数的时间间隔也将确定该函数。 只要注意每个窗口的长度即可。 上面给出的示例是使用第二个值a = 0.001计算的。 现在,我将显示使用其他窗口计算出的上述相同信号的STFT。
在这里插入图片描述首先,让我们看一下第一个最窄的窗口。 我们期望STFT具有很好的时间分辨率,但频率分辨率相对较差:
在这里插入图片描述上图显示了此STFT。 为了更好地解释,该图是从俯视鸟瞰图中以一定角度显示的。 注意,四个峰在时间上彼此很好地分开。 还要注意,在频域中,每个峰值都覆盖一个频率范围,而不是单个频率值。 现在让我们扩大窗口,看一下第三个窗口(第一个示例中已经显示了第二个)。
在这里插入图片描述请注意,与以前的情况不同,这些峰在时间上并没有很好地分离,但是,在频域中,分辨率要好得多。 现在,让我们进一步增加窗口的宽度,看看会发生什么:

在这里插入图片描述好吧,这对于现在的任何人都不应该感到惊讶,因为我们期望得到一个糟糕的(我的意思是绝对可怕的)时间分辨率。

这些示例应该已经说明了STFT分辨率的隐含问题。 任何想使用STFT的人都面临着分辨率问题。 使用哪种窗口? 狭窄的窗口提供了良好的时间分辨率,但频率分辨率却很差。 宽窗口可提供良好的频率分辨率,但时间分辨率较差; 此外,宽大的窗户可能会违反平稳状态。 当然,问题是选择窗口函数一劳永逸,并在整个分析中使用该窗口的结果。 答案当然取决于应用程序:如果原始信号中的频率成分彼此分离良好,那么我们可能会牺牲一些频率分辨率并获得良好的时间分辨率,因为频谱成分已经彼此充分分离 。 但是,如果不是这种情况,那么良好的窗口函数可能比找到好的股票进行投资更加困难。

现在,您应该已经意识到小波变换是如何发挥作用的。 小波变换(WT)在一定程度上解决了分辨率的难题,这将在下一部分中看到。

这样就完成了本教程的第二部分。 连续小波变换是本教程第三部分的主题。 如果到现在为止您没有太多麻烦,并且上面写的对您来说很有意义,那么您现在准备在理解小波理论的基本概念时面对最终挑战。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值