尺度空间定义
说到尺度空间理论最早可以追溯到1962年的T.Iijima最先提出,学术界开始关注尺度空间技术主要在1986年IEEE PAMI上同时刊出的4篇关于尺度空间理论的文章奠定了发展基础。现实世界中物体只有具备一定的尺度才能够倍人眼所察觉,计算机视觉学术研究就是在不断的尝试与突破来模拟人眼的观察方法。因此,尺度空间就是试图在图像领域中模拟人眼观察物体的概念与方法。例如:观察一颗树,关键在于我们想要观察是树叶子还是整棵树:如果是一整棵树(相当于大尺度情况下观察),那么就应该去除图像的细节部分。如果是树叶(小尺度情况下观察),那么就该观察局部细节特征。
构建尺度空间的过程中,其实是在不断的去除细节过程同时不能够引进新的错误细节特征。想想尺度空间金字塔进行高斯滤波时候,原始图像保存最多的细节特征,经过高斯滤波后细节特征逐渐减少来模拟大尺度情况下的特征表示。那么,什么是尺度空间?能否给尺度空间技术有个数学上定义或者判断准则呢?示例参考于:










尺度空间多为多尺度技术的分支和作为金字塔概念的延伸与发展,一般尺度的概念可以有以下几种表示:
1 以图像分辨率作为评判准则(图像在多分辨率情况下展示的物体)。
2 人眼观察图像轮廓大小的标准。
3 观察物体距离的远近作为判断标准。
4 滤波卷积核参数作为判断标准。
现实情况下物体距离观察者所处位置的远近而呈现出不同的表达,如人眼观察物体在不同的尺度下感受不同,距离较远时观察到的是主要轮廓区域,近距离下观察到更多的细节信息。大尺度参数情况下,高频信息丢失严重,主要显示大致轮廓信息,高频段细节被称作图像中显著的特征。高频信息在视觉领域易于发现与辨识,能够运用于进行特征提取、目标识别等任务。这就是不同尺度下所带来的效应。计算机视觉中的多尺度技术想要表达的基本思想是大尺度情况下图像模糊轮廓形状是小尺度情况下图像轮廓形状的采样。
尺度空间发展及其分类
尺度空间能够很好的模拟人眼观察事物的情况,因此在计算机视觉领域中得到很好的应用。构建尺度空间方法主要分为两类:线性尺度空间与非线性尺度空间。其实线性与非线性尺度空间的主要区别在于滤波核函数的不同。线性尺度空间主要核函数是高斯核函数:其计算简单,高效。同时高斯核函数是唯一的尺度不变核函数尺度不变性论文。但是,高斯函数主要的缺点在于无法有效的分辩均匀区域与边缘区域,都是相同的滤波尺度,导致丢失大量局部细节。所以,针对高斯滤波的缺陷,非线性尺度空间理论被提出与应用。非线性滤波核函数当下主要有:双边滤波、非线性扩散滤波等。非线性滤波函数主要解决高斯滤波无法有效分辨均匀与边缘的判决,因此非线性滤波核函数能够保留更多的(高频)边缘信息同时滤波均匀区域。当然,非线性滤波核函数计算复杂度也随之提升。
SIFT尺度空间生成过程
说到SIFT算法在构建尺度空间过程可以归纳为:不同大小的高斯核函数对图像进行卷积滤波同时在层级变换之间进行下采样来构建金字塔模式下的尺度空间。SIFT算法在构建尺度空间时候采取高斯核函数进行滤波,主要原因有两个:1 高斯核函数是唯一的尺度不变核函数。2 DoG核函数可以近似为LoG函数,这样可以使特征提取更加简单。同时,David. Lowe作者在论文中提出将原始图像进行2倍上采样后滤波能够保留更多的信息便于后续特征提取与匹配。其实尺度空间图像生成就是当前图像与不同尺度核参数 σ σ σ进行卷积运算后产生的图像。
那么下面就以图像方式表述一下尺度空间构建过程:

如上图6尺度空间金字塔构建过程示意图,分别为不同尺度下的卷积滤波后的图像迭代演化。其中 S S S代表每组中层数(即X方向产生卷积图像个数), O O O为金字塔的塔数(即Y方向图像的列数)。SIFT算法中构建高斯金字塔组数一般计算默认如下: O = [ l o g 2 ( m i n ( w , h ) ) ] − 3 O=[log_2(min(w,h))]-3 O=[log2(min(w,h))]−3 其中 ( w , h ) (w,h) (w,h)分别表示图像的宽高。其中每组中的层数 S S S一般设置为3~5。二维高斯空间函数: G ( x i , y i