目标检测之ROI Pooling层解析

ROI Pooling层是目标检测中的关键组件,解决了特征图尺寸不固定的问题,确保输出固定大小的特征层。该层有两个输入:固定大小的特征图和ROI矩阵。ROI是region of interests,fast RCNN中由selective search生成,faster RCNN中来自RPN。ROI Pooling通过映射、分块和最大池化操作,将不同大小的ROI转换为固定尺寸,加速训练和测试,提升检测精度。
摘要由CSDN通过智能技术生成

参考:
1
2

  1. ROIs Pooling是Pooling层的一种,特点是输入特征图尺寸不固定,但是输出特征层尺寸固定。

  2. ROI即region of interests,指的是特征图上的框。

  3. 在fast rcnn中,roi是指的是selective search完成之后得到的候选框在特征图上的映射。如下图:
    在这里插入图片描述

  4. 而在faster rcnn中是在rpn之后产生的,然后再把各个候选框映射到特征图上,得到ROI。往往经过rpn之后得到的不仅仅只有一个候选框,所以一般指的是对多个ROI进行池化。

  5. 目标检测的过程可以分为如下两个阶段:
    阶段一:region proposal:给定一张image找出所有object可能存在的位置,这个阶段的输出是所有object可能位置的bounding box。这些bounding box称为region proposals或者regions of interests(ROI)。
    阶段二:final classification:确定上一阶段的每个region proposal是否属于某类目标或者背景类。
    目标检测的这两个阶段可能存在的问题是:
    (1&

  • 8
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值