ROI Pooling层

最新推荐文章于 2021-09-09 11:34:48 发布

swan777

最新推荐文章于 2021-09-09 11:34:48 发布

阅读量269

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/swan777/article/details/98945192

版权

目标检测专栏收录该内容

4 篇文章 0 订阅

订阅专栏

region proposal：

给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest（ROI）。

ROI pooling具体操作如下：

根据输入image，将ROI映射到feature map对应位置；
将映射后的区域划分为相同大小的sections（sections数量与输出的维度相同）；
对每个sections进行max pooling操作；

这样我们就可以从不同大小的方框得到固定大小的相应的feature maps。值得一提的是，输出的feature maps的大小不取决于ROI和卷积feature maps大小。ROI pooling 最大的好处就在于极大地提高了处理速度

ROI pooling具体操作如下：

根据输入image，将ROI映射到feature map对应位置；
将映射后的区域划分为相同大小的sections（sections数量与输出的维度相同）；
对每个sections进行max pooling操作；

ROI Pooling的输入

输入有两部分组成：
1. data：指的是进入RPN层之前的那个Conv层的Feature Map，通常我们称之为“share_conv”；
2. RoIs：指的是RPN层的输出，一堆矩形框，形状为1x5x1x1（4个坐标+索引index），其中值得注意的是：坐标的参考系不是针对feature map这张图的，而是针对原图的（神经网络最开始的输入）
ROI Pooling的输出

输出是batch个vector，其中batch的值等于roi的个数，vector的大小为(channel,w,h)；ROI Pooling的过程就是将一个个大小不同的box矩形框，都映射成大小为(w,h)的矩形框；

如图所示，我们先把RoI中的坐标映射到feature map上，映射规则比较简单，就是把各个坐标除以输入图片与feature map的大小的比值，得到了feature map上的box坐标后，我们使用pooling得到输出；由于输入的图片大小不一，所以这里我们使用的spp pooling，spp pooling在pooling的过程中需要计算pooling后的结果对应的两个像素点反映社到feature map上所占的范围，然后在那个范围中进行取max或者取average

ROI pooling example

考虑一个8*8大小的feature map，一个ROI，以及输出大小为2*2.

（1）输入的固定大小的feature map

（2）region proposal 投影之后位置（左上角，右下角坐标）：（0，3），（7，8）。

（3）将其划分为（2*2）个sections（因为输出大小为2*2），我们可以得到：

（4）对每个section做max pooling，可以得到：

参考链接：

https://www.cnblogs.com/Ann21/p/9824466.html

https://www.cnblogs.com/kk17/p/9693565.html

swan777

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ROI Pooling层

region proposal：给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest（ROI）。ROI pooling具体操作如下：根据输入image，将ROI映射到feature map对应位置；将映射后的区域...
复制链接

扫一扫

专栏目录