机器学习基础--多尺度

最新推荐文章于 2024-04-09 23:23:01 发布

whitenightwu

最新推荐文章于 2024-04-09 23:23:01 发布

阅读量4.5k

点赞数 1

分类专栏：机器学习基础

本文链接：https://blog.csdn.net/wydbyxr/article/details/81773027

版权

机器学习基础专栏收录该内容

51 篇文章 25 订阅

订阅专栏

尺度空间 (Scale Space) /分辨率不变

如果不同的尺度下都有同样的关键点，那么在不同的尺度的输入图像下就都可以检测出来关键点匹配，也就是尺度不变性。
另外，高斯核是唯一可以产生多尺度空间的核。

图像金字塔

一般包括2个步骤，分别是使用低通滤波平滑图像；对图像进行降采样（也即图像缩小为原来的1/4，长宽高缩小为1/2），从而得到一系列尺寸缩小的图像。图像金字塔也正如其名，是以一个降采样的形式来表示图像的多分辨率，类似一个金字塔形状。

特别的，高斯金字塔：
　　在多分辨率金字塔的基础上加入了高斯滤波，也就是对金字塔每层图像采用不同的参数sigma进行了高斯卷积，使得金字塔的每层有多张图片组成为一个Octave，每组有多张（也叫层interval）图像。

高斯核

在二维空间中，这个公式生成的曲面的等高线是从中心开始呈正态分布的同心圆。分布不为零的像素组成的卷积矩阵与原始图像做变换。每个像素的值都是周围相邻像素值的加权平均。原始像素的值有最大的高斯分布值，所以有最大的权重，相邻像素随着距离原始像素越来越远，其权重也越来越小。这样进行模糊处理比其它的均衡模糊滤波器更高地保留了边缘效果。

多尺度与金字塔多分辨率之间本质的区别

1）多尺度空间：是由不同高斯核平滑卷积得到，在所有尺度上有相同的分辨率（分辨率不变）；
2）金字塔多分辨率：表达每层分辨率减少固定比率（分辨率在变）。

所以，金字塔多分辨率生成较快，且占用存储空间少；而多尺度表达随着尺度参数的增加冗余信息也变多。多尺度表达的优点在于图像的局部特征可以用简单的形式在不同尺度上描述；而金字塔表达没有理论基础，难以分析图像局部特征。

不同的多尺度物体检测方法

这里写图片描述

(a)图是原图缩放，将目标缩放至与模板匹配的大小，多个Scale的原图对应不同Scale的Feature，该方法计算多次Scale，每个Scale提取一次Feature。
(b)图是相同的图像，导入不同的模型中（每个模型在训练时会使用不同的长度的图像。）
(e)图与方法a类似，但和a全图计算不同，只针对Patch计算。该方法在RCNN中使用，使用RCNN进行目标检测时，首先在原图上得到2000个建议框，这些建议框在变形成统一的尺寸大小（如227*227）在输入CNN网络中进行特征提取，这里的patch指的是建议框尺寸变换的过程，计算时只需对建议框进行计算，不需对原图全图计算。