多尺度与多分辨率的理解

最新推荐文章于 2024-09-02 13:48:39 发布

chgm_456D

最新推荐文章于 2024-09-02 13:48:39 发布

阅读量9.8k

点赞数 13

文章标签： image features function google input 存储

本文链接：https://blog.csdn.net/chgm_456D/article/details/8100513

版权

我一开始以为多尺度与多分辨率是一样的意思。后来看到了xiaowei_cqu博客的一篇文章“【OpenCV】SIFT原理与源码分析：DoG尺度空间构造”(以下简称，xiaowei一文)，才发现我的理解有误。

尺度空间（scale space）理论

要理解多尺度，首先要知道什么是尺度空间。xiaowei一文中提到，自然界中的物体呈现出不同的形态，需要不同的尺度观测。比如，建筑物用“米”测量，原子用“纳米”。比较形象的是，在平常使用的Google地图，可以滑动鼠标来改变地图的尺度；照相机通过调焦，将景物拉近拉远。尺度空间中各尺度图像的模糊程度逐渐变大，模拟了景物由近到远在视网膜形成过程。

为什么要讨论尺度空间？因为计算机在不知道图像尺寸的情况下，需要考虑多尺度以获取兴趣物体的最佳尺度。同时，在一幅图像的不同尺度下检测出相同的关键点来匹配，即尺度不变性。

尺度空间表达——高斯模糊

David Lowe 2004年在Int. Journal of Computer Vision 的经典论文（Distinctive Image Features from Scale-Invariant Keypoints）中，对尺度空间的定义：

“It has been shown by Koenderink (1984) and Lindeberg (1994) that under a variety of reasonable assumptions the only possible scale-space kernel is the Gaussian function. Therefore, the scale space of an image is defined as a function, L(x, y, σ), that is produced from the convolution of a variable-scale Gaussian, G(x, y, σ), with an input image, I (x, y)."

抽取要点：

1. 高斯核是唯一可以产生多尺度空间的核；

2. 一幅图像的尺度空间 L(x, y, σ), 定义为原始图像 I(x,y) 与一个可变尺度的2维高斯函数G(x, y, σ)卷积运算。

即尺度空间形式表示为：

其中，

（金字塔）多分辨率表达——降采样

图像金字塔化一般包括两个步骤：使用低通滤波器平滑图像；对图像进行降采样（通常是水平，竖直方向1/2），从而得到一系列尺寸缩小的图像。对于二维图像，每一层图像由上一层分辨率的长、宽各一半，也就是四分之一的像素组成。

多尺度和多分辨率的区别
最大的不同：
尺度空间表达是由不同高斯核平滑卷积得到，在所有尺度上有相同的分辨率；
而（金字塔）多分辨率表达每层分辨率减少固定比率。

所以，（金字塔）多分辨率生成较快，且占用存储空间少；而多尺度表达随着尺度参数的增加冗余信息也变多。
多尺度表达的优点在于图像的局部特征可以用简单的形式在不同尺度上描述；而（金字塔）多分辨的表达没有理论基础，难以分析图像局部特征。

参考资料：xiaowei_cqu 的【OpenCV】SIFT原理与源码分析：DoG尺度空间构造