NMS算法conclusion与ROI Pooling原理

1 篇文章 0 订阅

NMS定义 

  • 非极大值抑制(Non-Maximum Suppression,NMS),即抑制不是极大值的元素,可以理解为局部最大搜索。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小

NMS具体的方法描述(Selective Search Warp

假设有下面一张图

为了定位一个车辆,算法找出了一堆的方框,我们需要判别哪些矩形框是没用的。非极大值抑制的方法是:先假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大属于车辆的概率 分别为A、B、C、D、E、F。

  • 从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值
  • 假设B、D与F的重叠度超过阈值,那么就扔掉B、D(因为重复了);并标记第一个矩形框F,是我们保留下来的。
  • 从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框

就这样一直重复,找到所有被保留下来的矩形框。

NMS流程图演示

obj-det-pipline

为何要引入 ROI Pooling?

  1. 实时性:产生大量的region proposals 会导致performance problems,很难达到实时目标检测。
  2. 保持输出大小一致,且不失真:对于传统的CNN(如AlexNet和VGG),当网络训练好后输入的图像尺寸必须是固定值,同时网络输出也是固定大小的vector or matrix。如果输入图像大小不定,这个问题就变得比较麻烦
  3. 在处理速度方面是suboptimal。
  4. 无法做到end-to-end training。这里写图片描述

 ROI pooling具体操作如下

  1. 根据输入image,将ROI映射到feature map对应位置;
  2. 将映射后的区域划分为相同大小的sections(sections数量与输出的维度相同);
  3. 对每个sections进行max pooling操作
  • 注意最后的输出的大小已经确定下来了,即pooled_w x pooled_h固定大小
  • 假设我们有8*8大小的feature map,一个ROI,我们的固定大小设置为2*2
  • 固定大小的feature map如下这里写图片描述
  • 将region proposal投影到对应的位置上 这里写图片描述
  •  将其划分为(2*2)个sections(因为输出大小为2*2):可以看到,划分是尽可能等分划分这里写图片描述
  • 对划分后的section做max pooling,可以得到
  • 这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值