可操纵金字塔Steerable Pyramids

可操纵金字塔分解的介绍

原文地址:https://medium.com/@itberrios6/steerable-pyramids-6bfd4d23c10d

金字塔分解在计算机视觉中很常见,但有一种金字塔不常被讨论,那就是可操纵金字塔。这篇文章深入探讨了可操纵金字塔的基础知识,并提供了可视化图来帮助提供更深入的理解。其主要思想是查看分解是如何执行的,并在此过程中了解它的属性。这里将显示一些代码,以提供一个大致的概念,本教程的完整代码可以在GitHub上找到。但是,我建议对于任何严肃的应用程序使用pyrtools

我们假设你熟悉图像金字塔和空间频率的概念,如果你认为你需要复习,请回顾链接的来源。这里有一个概述:

背景

图像金字塔是图像的多尺度分解,这意味着图像被缩小多次,得到越来越小的尺寸。将图像分解为多个尺度的主要优点是,在一个尺度上不明显的信息,在另一个尺度上可能会更加明显。一个常见的例子是高斯金字塔,图像被反复高斯模糊和次采样。

Figure 1. Example of a Gaussian Pyramid with a depth of 5 levels.  Source.

另一种是拉普拉斯金字塔,下采样图像与其高斯模糊对应图像之间的残差(差)组成了它的水平。图2中的这些残差h₀和h₁实际上是带通滤波图像,随着尺度的降低,频率也会降低,直到我们得到最终的低通分量f₂。拉普拉斯金字塔是4/3(4/3(1+1/4+1/16+...\approx 4/3)的超完备系数。 

关于过度完备性的注意事项:完备意味着分解(或变换)编码了所有图像信息,并且是可逆的。过完备意味着完整和过采样,这意味着分解包含足够多的信息来重建原始图像。我们也可以说,过完全分解的维度高于输入的维度

Figure 2. Example of a Laplacian Pyramid.

图像金字塔的一个有趣用例是图像混合,不同的空间尺度可以使图像从一个图像平滑过渡到另一个图像。另一种是创建图像的卡通,其中较小的图像尺度提供最能代表图像整体的颜色。荣誉奖将是用于目标检测的古老的多尺度模板匹配技术。 

Steerable Pyramids

可操纵金字塔为金字塔分解增加了方向的概念。在每个子尺度上,我们现在有多个方向,与拉普拉斯金字塔一样,每个空间尺度对应于不同的频带。当我们降低比例时,频率就会降低,直到我们得到最后的低通分量。高斯金字塔和拉普拉斯金字塔具有描述尺度的层次,但可控金字塔具有描述尺度(频率)和方向的子带。可控金字塔是不同子带滤波器的集合,其中还包括单独的低通和高通分量。低通和高通组件没有选择性地转向一个方向,它们包含了整个360°。

由于频率子带的概念,方向可调金字塔最适合在频域描述。现在让我们深入了解如何计算其中的一种分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值