ROI Pooling的作用及意义

什么是ROI pooling?
ROI pooling 是对(Region of Interest)进行Pooling操作,广泛应用在物体检测的研究领域。
该操作的目的是对输入feature map中的不同大小的ROI利用池化方法获得固定大小的输出feature map。

ROI Pooling层的输入
1,经过基础网络卷积和池化后的固定大小的特征图;
2,表示ROI信息的N*5维的矩阵,其中N表示ROI数目,纵坐标的第一列表示图片在输入特征图batch中的索引,之后四位是ROI的左上角和右下角坐标的信息。
换个说法,实际上这部分输入就是rois:指的是RPN层的输出,一堆矩形框,形状为1x5x1x1(4个坐标+索引index),其中值得注意的是:坐标的参考系不是针对feature map这张图的,而是针对原图的(神经网络最开始的输入)。

ROI Pooling的输出
输出是batch个vector,其中batch的值等于roi的个数,vector的大小为channelwh;ROI Pooling的过程就是将一个个大小不同的box矩形框,都映射成大小为w*h的矩形框;

举例:(数字是随意举例的,仅仅为了说明道理)
假设输入的ROI大小为8060,期望输出的ROI固定大小为106;
那么将输入的ROI(8060)划分为106块,即每块的大小为(80/10,60/6)。
对每一块分别进行最大或者最小Pooling操作,即得到了10*6的期望大小的输出ROI。

  • 8
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

thequitesunshine007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值