数字图像处理-小波变换小白解释基本原则

最新推荐文章于 2024-09-11 13:11:38 发布

HelloZEX

最新推荐文章于 2024-09-11 13:11:38 发布

阅读量1.8w

点赞数 29

分类专栏：数字图像处理文章标签：图像处理小波变换

数字图像处理专栏收录该内容

26 篇文章 13 订阅

订阅专栏

内容完全转载：

小波理论的基本概念及概述（第二版）

欢迎阅读此份关于小波变换的入门教程。小波变换是一个相对较新的概念（其出现大约是在20世纪80年代），但是有关于它的文章和书籍却不少。这其中大部分都是由数学专业人士写给其他同行看的，不过，仍然有大量数学专家不知道其他同行们讨论的是什么（我的一个数学教授就承认过）。换言之，大多数介绍小波变换的文献对那些小波新手们来说用处不大（此为个人观点）。

我刚开始接触小波变换的时候，曾经为了搞清楚小波变换这个这个神奇的世界到底发生了什么而苦苦挣扎，因为在这个领域的入门教材非常少。因而，我决定为新手们写一份教程。我自认为也是一个新手，必须承认，我也有很多理论细节没有弄清楚。不过，就工程应用而言，我认为弄清楚所有的理论细节大可不必。

这份教程将试着介绍一些小波理论的基本原理，并且不会给出这些原理和相关公式的证明，因为这份教程的目标读者暂时还不需要知道这些。不过，感兴趣的读者可以参阅引用的文献以便了解更深入的内容。

此篇文档假定你没有任何相关知识背景。要是有的话，请跳过以下内容，这些对你而言可能都是显然的。

要是你发现教程里有任何前后不协调或不正确的内容，请联系我。我很乐于收到关于教程的任何评论。

变换…啥？

首先，为什么需要变换，或者说到底什么是变换？

为了获取在原始信号中不易获得的信息，往往要对信号进行数学变换。以下篇幅均假定时域内信号为原始信号，经过数学变换后的信号为处理信号。

可用的变换有很多种，其中，傅立叶变换大概是目前最流行的。

实际中，多数信号的原始形式都是时域信号，也即不论如何测得的，信号总是关于时间的函数。换言之，绘制信号的图形时，一个轴代表时间（自变量），另一轴代表信号幅值（因变量）。在时域内作图，便可得到信号的时-幅表示。在多数信号处理有关的应用场景中，这种表示并不是最好的表示。很多时候，最易分辨的信息往往隐藏在信号的频率成分中。信号的频谱是指信号中的频率分量（或谱分量），其表示的是信号中存在哪些频率成分。

直觉上，我们都知道频率是跟事物的变化率有关的量。如果一样东西（专业术语应该为数学量或物理量）变化得很快，则它的频率就高；变换得慢，或者说变化得很平滑，则它的频率就低。如果该量保持不变，则其频率为零，或者说没有频率。例如，日报的频率就比月刊高（因为日报出版快）。

频率用“循环次数/秒”，或者用更常用的“赫兹”来衡量。例如，在美国，日常生活中所用交流电的频率是60Hz（世界上其他一些地区是50Hz）。这意味着，如果我们想要绘制电流变化曲线，得到的将是1秒内往复50次的正弦波。看下面几张图，第一幅图中是频率是3Hz的正弦信号，第二幅是频率10Hz的，第三幅则是频率50Hz，对比下吧。

那么怎样测量频率，或者说怎样得到一个信号中所含的频率成分呢？答案是傅立叶变换(FT)。对时域信号做傅立叶变换，就会得到信号的频谱。也就是说，此时我们绘制信号图形的话，一个轴是频率，另一个轴是频率分量的幅值。所得图像将告诉我们信号中包含的各种频率成分分别有多少。

频率轴从零开始，直至正无穷。每个频率都对应一个幅值。例如，如果我们对房间所用的电流信号做傅立叶变换，频谱图中在50Hz处会出现尖峰，其它频率对应的幅值则为零，因为信号中只包含了50Hz的频率分量。然而，很少有信号的傅立叶变换是如此简单的。实际中的信号大都包含多个频率分量。50Hz信号的傅立叶变换如下图所示：

图 1.4 50 Hz 信号的傅里叶变换

注意，图1.4给出了上下两张图，下图显示的其实是上图的前半部分。这是因为实值信号的频谱图是左右对称的，这点暂时不理解也无妨。上图能够看出这一特性。不过，由于后一半对称部分只不过是前一半图形的镜像，并未提供额外信息，因此，这部分经常不画出来。下文中出现的多数频谱图，我将只绘出前半部分。

为什么需要频率信息？

通常，一些在时域中不易看出的信息很容易在频域中观察到。

看一个生物信号的例子。设想我们正在观察一个心电信号。心脏专家一般都熟知典型的健康人心电图的形状。与这些典型形状存在显著偏差往往是疾病的征兆。

一些病征在时域表示的心电信号中并不明显。过去，心脏专家一般用记录在磁带上的时域心电图来分析心电信号。最近，新型的数字心电记录仪/分析仪可以利用心电图的频域信息来判断病征是否存在。对心电信号的频率成分进行分析能使他们更容易的诊断病情。

上面只是一个说明频率成分作用的简单例子。当前，傅立叶变换已经被用于不同的领域，涵盖了工程领域的各个分支。

尽管傅立叶变换可能是使用最多的（特别在电气工程领域），但它并不是唯一的变换。许多其他的变换也常为工程师和数学家们所用，如希尔伯特变换、短时傅立叶变换（下文会有更多介绍）、魏格纳分布和雷登变换，当然还有教程的主角——小波变换，而这些也仅是工程师和数学家们所用变换中的一小部分。每种变换都有其应用领域，也有其优缺点，小波变换也不例外。

为了更好地理解为什么需要小波变换，我们需要更深刻地认识傅立叶变换。傅立叶变换是一种可逆变换，即它允许原始信号和处理信号之间互相变换。但是，在任意时刻只有一种信号形式是可用的。也就是说，在时域信号中不包含频率信息，而经过傅里叶变换后的信号则不包含任何时间信息。说到这，头脑里很自然地会提出一个问题，为什么需要同时知道时间和频率信息呢？

我们马上就会知道，答案是具体问题具体分析。回想一下，傅立叶变换给出了信号中的频率信息，即它可以告诉我们原始信号包含各个频率成分到底有多少，但是并未告诉我们某个频率信号何时出现。对于所谓的平稳信号，这些信息并不需要。

让我们进一步探讨一下平稳的概念，因为它在信号分析中具有重要意义。如果信号中的频率分量不随时间变化，则称这类信号为平稳信号。平稳信号中的频率分量一直保持不变，那么，自然无需知道频率分量是何时出现的，因为所有的频率分量出现在信号的每一刻！！！

以如下信号为例：

这是个平稳信号，因为任何时刻都包含10，25，50和100Hz的频率。信号的图形如下：

图 1.5

下图为它的傅立叶变换：

图 1.6

图1.6中的上图是图1.5中信号的频谱图，下图为上图的放大，给出了我们关注部分的频率范围。注意四个频率10，25，50和100Hz的频谱分量。

与图1.5中的信号不同，下图所示的就是一个非平稳信号。图1.7中，信号的频率随着时间一直在变化，这种信号称为线性调频信号，是一种非平稳信号。

图 1.7

让我们再看一个例子，图1.8绘出的是一个包含四个频率分量的信号，它们分别在不同时刻出现，因此这是一个非平稳信号。0至300ms时是100Hz的正弦波，300-600ms时则是50Hz的正弦波，600-800ms时是25Hz的正弦波，最后的200ms内是10Hz正弦波。

图 1.8

下图是它的傅立叶变换：

图 1.9

不要介怀图中的那些小波纹，这是由信号中频率突变引起的，在这里并不重要。注意，高频分量的幅值比低频分量大，这是因为高频信号（300ms）比低频信号（200ms）持续时间更长。（频率分量幅值的精确值并不重要）。

除了那些波纹，图中的一切看起来都是正确的。频谱图有四个尖峰，对应原始信号中的四个频率分量，幅值也差不多是合理的…没错

错！

当然了，也不全错，但也不全对。对图1.5中的信号，考虑如下问题：各个频率分量都是在什么时刻出现的？

答案是

在所有时刻！还记得平稳信号吗，所有频率分量在信号的整个持续时间内一直存在。10Hz的频率分量一直存在，50Hz的分量也是，100Hz的分量依然是。

现在，让我们来考虑一下图1.7或1.8中的非平稳信号。

各个频率分量都是在什么时刻出现的？

对于图1.8中的信号，我们知道，第一个时间区间内出现的是频率最高的分量，最后一个时间区间内出现的是频率最低的分量。图1.7中，信号的频率成分随时间连续变化，因此，对这些信号来说，各个频率分量并未在所有时刻一直存在。

现在，对比图1.6和1.9，两幅频谱图的相似之处是显而易见的。两幅图中都包含了四个相同的频率分量，即10，25，50和100Hz。除了一些小波纹和两幅图中各频率分量的幅值（这些幅值可以做归一化处理）有所区别，两幅频谱图几乎是相同的，尽管两个信号在时域内差别很大。两个信号都包含了相同的频率分量，但是前者中，各频率分量存在于信号的整个周期内，而后者的频率分量则分别存在于不同的时间区间内出现。那么，为什么两个完全不同的信号，频谱图形这么相像呢？回想一下，傅立叶变换仅仅给出了信号的频谱分量，但却没有给出任何关于这些分量出现时间的信息。因此，傅立叶变换并不适用于分析非平稳信号，但有一个例外：

如果我们仅关心信号中包含哪些频率分量而不关心它们出现的时间，傅立叶变换仍可用于处理非平稳信号。但是，如果我们想知道频率分量出现的确切时间（区间），傅立叶变换就不再适用了。

实际应用中，由于平稳的和非平稳的信号都很多，很那将二者区分开来。例如，几乎所有的生物信号都是非平稳的，包括广为人知的心电图(ECG)、脑电图(EEG)和肌电图(EMG)。

再次注意，傅立叶变换仅能给出信号中包含哪些频率分量，仅此而已。

当需要对频谱分量进行时间定位时，我们就需要一个可以给出信号时-频表示的变换。

终极解决方案：小波变换

小波变换是这种类型的变换，它提供了信号的时频表示（还有一些变换也可给出这些信息，如短时傅立叶变化，魏格纳分布等等）。

特定的频谱分量在特定的时刻出现往往具有特殊的意义。这些情况下，了解这些特定的频谱分量出现的时间区间会非常有用。例如，在脑电图中，事件相关电位的延迟时间需要特别注意（事件相关电位是指大脑对某一特定刺激的反应，类似闪光灯，延迟时间是从接受刺激到作出反应之间耗费的时间）。

小波变换能够同时提供时间和频率信息，因此给出了信号的一种时频表示。

小波变换到底是如何奏效的完全是另外一个故事，需要在理解了短时傅立叶变换(STFT)之后再做解释。小波变换的出现是为了改进短时傅立叶变换(STFT)。STFT将在教程的第II部分详细阐述。现在暂时可以认为小波变换是为了解决STFT中遇到的有关分辨率的问题而发展起来的。

为了长话短说，我们略过时域信号处理中有关于各种高通和低通滤波器的相关内容。这些滤波器用来过滤信号中的低频和高频部分分量。这类方法被重复实施，每次都会从信号中滤除一些频率分量。

这里解释一下滤波是如何奏效的：设想我们有一个信号，其中频率最高的分量为1000Hz。第一步，我们通过高通和低通滤波器把信号分成两个信号（滤波器必须满足某些特定的条件，即容许条件），结果得到了同一信号的两个部分，0-500Hz的部分（低通部分）和500-1000Hz的部分（高通部分）。

然后，我们可以拿其中一部分（通常是低通部分）或者二部分，然后对每一部分继续进行相同的操作。这个过程叫做分解。

假设我们拿低频部分做了处理，现在我们就有了3组数据，分别为信号在0-250Hz，250-500Hz和500-1000Hz的部分。

然后再对低通部分的信号继续做高通和低通滤波处理；现在我们就有了4组数据，分别为0-125Hz，125-250Hz，250-500Hz和500-1000Hz。我们持续进行这个过程，直到将信号分解到一个预先定义的水平。这样我们就有了一系列信号，这些信号实际上都来自相同的信号，但是每一个都对应不同的频带。我们知道每个信号对应的频段，如果我们将这些信号放在一起画出三维图，一个轴表示时间，频率在另外一个轴上，幅度在第三个轴上。这幅图会告诉我们各个频率出现哪些时刻（这里有一个问题，叫做“不确定性原理”，即我们不能精确地知道哪个频率出现在哪些时间点，我们仅能知道某一频段出现在哪一时间区间内，后文中将有更多介绍）。

不过，我仍想简单地解释一下：

不确定性原理最早由海森堡发现并阐述，其表述为：移动粒子的动量和位置不可同时确定。在我们这个课题里则是这样：

时-频平面内的一个确定的点上，信号的频率和时间信息不能同时知道。换句话说：在任一时刻，我们无法确定存在哪个频谱分量。我们最多只能做到，在一个给定的时间区间内存在哪些频谱分量。这是一个分辨率的问题，也是研究者们从快速傅立叶变换(STFT)切换到小波变换(WT)的主要原因。快速傅立叶变换的分辨率随时间是固定不变的，而小波变换则能给出可变的分辨率：

高频信号在时域内很好分辨，低频信号则在频域内容易分辨。这意味着，相对于低频分量，高频分量更容易在时域内定位（有更小的相对误差）。反而言之，低频分量更容易在频域内定位。看下面的网格图：

对上图的解释是：最上面一行表明，高频信号有更多的采样点和较短的采样间隔。就是说，高频信号更容易在时域内分辨。最下面一行是对低频信号的采样，描述信号的特征点较少，因此，低频信号在时域内并不容易分辨。