关于目标检测中的候选区域Region Proposal的理解

最新推荐文章于 2022-11-14 21:28:18 发布

置顶 Jeremy_lf

最新推荐文章于 2022-11-14 21:28:18 发布

阅读量3.1k

点赞数

分类专栏：论文阅读目标检测文章标签：神经网络深度学习计算机视觉

本文链接：https://blog.csdn.net/Jeremy_lf/article/details/105228054

版权

论文阅读同时被 2 个专栏收录

20 篇文章 1 订阅

订阅专栏

目标检测

12 篇文章 2 订阅

订阅专栏

目标检测指的是在一张图像中能够检测出物体所在的区域并且给出物体类别概率，其核心可以分为定位与识别两大模块。定位指的是我们在目标图像中锁定物体所在的区域，然后送入分类网络完成物体的识别。

图像定位常用方法具体介绍如下：

滑窗法—sliding window

滑窗法是指用不同大小的窗口在整个图像上进行滑动，然后对每个窗口区域进行检测，复杂度极大，效率低下，此外还必须考虑到高宽比例不一致的情况，搜索变得更为复杂！
在这里插入图片描述

候选区域—Region Proposal

选择搜索(Selective Search)

主要观点：图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。因此，选择搜索基于上面这一想法采用子区域合并的方法进行提取bounding boxes候选边界框。首先，对输入图像进行分割算法产生许多小的子区域。其次，根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并，不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形)，这些子区域外切矩形就是通常所说的候选框。
在这里插入图片描述
除选择搜索外，还有以下生成区域的方法：objectness；category-independen object proposals；constrained parametric min-cuts(CPMC)；multi-scale combinatorial grouping
Ciresan

NMS

NMS即non maximum suppression即非极大值抑制，经常用在目标检测当中，用来过滤掉那些局部的非极大值。一般是通过IOU来进行过滤。其中IOU为bounding box 与 ground truth 的重叠度，即交集与并集的比值。

迁移学习

迁移学习一般指的是有监督的预训练。就是把一个任务训练好的参数，拿到另外一个任务，作为神经网络的初始参数值,这样相比于你直接采用随机初始化的方法，精度可以有很大的提高。

常用场景：图片分类标注好的训练数据非常多，但是物体检测的标注数据却很少，如何用少量的标注数据，训练高质量的模型，比如我们先对imagenet图片数据集先进行网络的图片分类训练。这个数据库有大量的标注数据。

Jeremy_lf

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
关于目标检测中的候选区域Region Proposal的理解

目标检测指的是在一张图像中能够检测出物体所在的区域并且给出物体类别概率，其核心可以分为定位与识别两大模块。定位指的是我们在目标图像中锁定物体所在的区域，然后送入分类网络完成物体的识别。图像定位常用方法具体介绍如下：滑窗法—sliding window滑窗法是指用不同大小的窗口在整个图像上进行滑动，然后对每个窗口区域进行检测，复杂度极大，效率低下，此外还必须考虑到高宽比例不一致的情况，搜索变得...
复制链接

扫一扫

专栏目录