RoI Pooling Layer

最新推荐文章于 2021-10-19 09:58:41 发布

VoNho

最新推荐文章于 2021-10-19 09:58:41 发布

阅读量4.2k

点赞数 9

分类专栏： cnn

cnn 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

方法提出的背景

目标检测一般分为两个阶段：

1. 输入一张image，输出一系列objects的可能位置（即：bounding box或region proposals或region of interest（ROI））

2. 确定1中的每个region proposal是否属于目标一类或者背景

问题：

产生大量的region proposals，很难达到实时目标检测，并且无法做到end-to-end training

ROI pooling layer的两个输入

1. 从具有多个卷积核池化的深度网络中获得的固定大小的feature maps

2. 一个表示所有ROI的N*5矩阵（N表示ROI的数目，第一列表示图像index，其余四列表示左上角和右下角坐标）

ROI pooling layer具体操作

1. 根据输入image，将ROI映射到feature map对应位置

2. 将映射后的区域划分为相同大小的sections（sections数量与输出的维度相同）

3. 对每个sections进行max pooling操作

这样我们就可以从不同大小的方框得到固定大小的feature maps

一个例子

考虑一个8*8大小的feature map，一个ROI，以及输出大小为2*2

1. 输入固定大小的feature map

2. region proposal投影之后的位置（左上角（0，3），右下角坐标（7，8））

3. 将其划分为2*2个sections（因为输出大小为2*2）

4. 对每个section做max pooling

总结

1. 用于目标检测

2. 允许对CNN中的feature map进行reuse

3. 可以显著加速training和testing

4. 允许end-to-end的形式训练目标检测系统

原文地址：https://blog.deepsense.ai/region-of-interest-pooling-explained/

关注

9
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
RoI Pooling Layer

方法提出的背景目标检测一般分为两个阶段： 1. 输入一张image，输出一系列objects的可能位置（即：bounding box或region proposals或region of interest（ROI）） 2. 确定1中的每个region proposal是否属于目标一类或者背景问题：产生大量的region proposals，很难达到实时目标检测，并且...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。