SIFT中的尺度空间和传统图像金字塔比较

最新推荐文章于 2024-07-11 21:37:55 发布

yuyin86

最新推荐文章于 2024-07-11 21:37:55 发布

阅读量894

点赞数

分类专栏：图形学基础文章标签：百度

图形学基础专栏收录该内容

95 篇文章 3 订阅

订阅专栏

最近在看多视角的全景图拼接的文章，感觉自己以前草草看了Lowe的文章很是不对。其中的尺度空间的理解更是欠妥当。下文是在丕子的网站转载过来的，由于不知道应该如何直接转载到百度，就这样直接COPY了。还望原谅，看完文章以后感觉到自己的确把计算机摄影学中讲的传统图像金字塔和Lowe的SIFT中的尺度空间混淆了。在此愧疚一下，不多说了，上文章.....

想要得知图像中哪些是有意义的，必须先要明确这样一个问题：在一幅图像中，只有在一定的尺度范围内，一个物体才有意义。举一个例子，树枝这个概念，只有在几厘米到几米的距离去观察它，才能感知到它的确是树枝；如果在微米级或者千米级去观察，就不能感知到树枝这个概念了，这样的话可以感知到的是细胞或者是森林的概念。

因而，如果想要描述现实世界的结构，或者将三维物体映射到二维的图像上去，多尺度表示将会至关重要。多尺度表示的概念很容易理解，举例说明，绘制地图时会有比例尺的概念。世界地图中就只能够显示大洲大洋，以及较大的地域和国家；而一个城市地图，甚至可以详细的显示出每条街道。这里需要强调一点，事物是实实在在的存在的，但是通过图像这个媒介，观察者可以感知到的概念是不同的。

一种比较老的尺度表示方法是图像金字塔。金字塔是结合降采样操作和平滑操作的一种图像表示式。它的一个很大的好处是，自下而上每一层的像素数都不断减少，这会大大减少计算量；而缺点是自下而上金字塔的量化变得越来越粗糙，而且速度很快。（需要强调的是，这里的金字塔构造方法和小波金字塔的构造方法是类似的，对某一层的图像进行平滑之后，再做降采样，平滑目的是为了降采样后的像素点能更好的代表原图像的像素点，与多尺度表示中的平滑完全不是一个目的）

SIFT中提到的“尺度空间”（Scale-Space）表示法是多尺度表示的另外一种有效方法，它的尺度参数是连续的，并且所有尺度上空间采样点个数是相同的（实际上，一个尺度上得到的就是一幅图像，尺度空间采样点也就是该尺度上图像的像素点。也就是说，尺度空间表示法在各个尺度上图像的分辨率都是一样的）。尺度空间表示的主要思想是，由原始信号（例如一幅图像）生成一系列信号，并用这些信号来表示原始信号，这个过程中，精细尺度的信息被逐步的平滑掉（可以认为是细节信息被丢弃）。

可变高斯函数表示为 $G \left( x, y, \sigma \right) = \frac{1}{2\pi\sigma^2}e^-(x^2+y^2)/2\sigma^2$

所以，这里的尺度空间和传统图像金字塔的表示是不同的，此处的尺度空间可以理解为用高斯对图像做了卷积，图像的分辨率还是那么大，像素还是那么多，只是细节被平均（平滑）掉了，原因就是高斯了。传统图像金字塔关键在于下采样，每四个像素，求平均作为一个像素，显然分辨率降低了。

下面就是Octave和sigma这两个参数的影响，行与行之间的差距，可以理解为金字塔或者降采样；行内部其实是因为高斯sigma参数作用的结果，高斯卷积其实是起到了一个平滑的作用：

yuyin86

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
SIFT中的尺度空间和传统图像金字塔比较

最近在看多视角的全景图拼接的文章，感觉自己以前草草看了Lowe的文章很是不对。其中的尺度空间的理解更是欠妥当。下文是在丕子的网站转载过来的，由于不知道应该如何直接转载到百度，就这样直接COPY了。还望原谅，看完文章以后感觉到自己的确把计算机摄影学中讲的传统图像金字塔和Lowe的SIFT中的尺度空间混淆了。在此愧疚一下，不多说了，上文章..... 想要得知图像中哪些是有意义的，
复制链接

扫一扫