关于目标检测中的候选区域Region Proposal的理解

目标检测指的是在一张图像中能够检测出物体所在的区域并且给出物体类别概率,其核心可以分为定位与识别两大模块。定位指的是我们在目标图像中锁定物体所在的区域,然后送入分类网络完成物体的识别。

图像定位常用方法具体介绍如下:

滑窗法—sliding window

滑窗法是指用不同大小的窗口在整个图像上进行滑动,然后对每个窗口区域进行检测,复杂度极大,效率低下,此外还必须考虑到高宽比例不一致的情况,搜索变得更为复杂!
在这里插入图片描述


候选区域—Region Proposal

选择搜索(Selective Search)

主要观点:图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。因此,选择搜索基于上面这一想法采用子区域合并的方法进行提取bounding boxes候选边界框。首先,对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形),这些子区域外切矩形就是通常所说的候选框。
在这里插入图片描述
除选择搜索外,还有以下生成区域的方法:objectness;category-independen object proposals;constrained parametric min-cuts(CPMC);multi-scale combinatorial grouping
Ciresan


NMS

NMS即non maximum suppression即非极大值抑制,经常用在目标检测当中,用来过滤掉那些局部的非极大值。一般是通过IOU来进行过滤。其中IOU为bounding box 与 ground truth 的重叠度,即交集与并集的比值。


迁移学习

迁移学习一般指的是有监督的预训练。就是把一个任务训练好的参数,拿到另外一个任务,作为神经网络的初始参数值,这样相比于你直接采用随机初始化的方法,精度可以有很大的提高。

常用场景:图片分类标注好的训练数据非常多,但是物体检测的标注数据却很少,如何用少量的标注数据,训练高质量的模型,比如我们先对imagenet图片数据集先进行网络的图片分类训练。这个数据库有大量的标注数据。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值