【深度学习小知识】ROI到ROI pooling 再到ROI Align

最新推荐文章于 2024-08-16 10:25:43 发布

你好啊：）

最新推荐文章于 2024-08-16 10:25:43 发布

阅读量7k

点赞数 14

分类专栏：深度学习小知识文章标签：深度学习 pytorch 神经网络

本文链接：https://blog.csdn.net/leomn_j/article/details/120221090

版权

深度学习小知识专栏收录该内容

5 篇文章 2 订阅

订阅专栏

ROI！RoI Pooling！

ROI详解
RoI Pooling详解
- Pooling操作
- ROI pooling
ROI Align详解

ROI详解

Region of interest(ROI),中文译为感兴趣区域。在计算机视觉领域，从输入的图像中框选处理待处理的区域就是ROI。
ROI / Region proposals大致过程：

输入一张图片
在图片中找到物体/目标（objects）的所有位置
输出/获得这些一系列的objects的bounding box.

RoI Pooling详解

Pooling操作

在了解ROI pooling前，先了解一下pooling操作
以2x2的maxpooling为例，能够在2x2大小中选取一个最大值。
如下图所示4x4的矩阵，变为了2x2的矩阵。
在这里插入图片描述

ROI pooling

Roi pooling的操作流程：

输入图像后经过特征提取，得到特征图（Feature Map）。
RoI区域映射到特征图上（映射：与ROI在原图上的位置相对应）。
将映射后的区域划分成多个部分，部分的数目的输出的维度有关。
对每个部分进行pooling(max pooling)操作。

下面是一个图像的特征图，使用0.88、0.44等构成的8x8矩阵进行表示，需要输出2x2大小的矩阵。
在这里插入图片描述
图中红框表示ROI在Feature map 上的映射区域，（1，2）和（7，7）分别表示映射区域的左上角及右下角坐标。
(怎么映射？特征图和原图存在一定的大小比例，按照比例对原图上的ROI区域进行调整，就能够得到红色区域)
在这里插入图片描述
现在要输出2x2的矩阵，所以要将ROI映射区域划分为四个部分（现在ROI区域是5 x 6 大小）。
划分过程如下：

5/2 =2.5，即将5行划分为 2 + 3 行两部分
6/2 = 3,即将6列平均划分为 3+3列两部分
当然，现在我们不用 2 X 2 大小的maxpooling进行池化，大小不够。
而使用 2 X 3 和3 X 3的maxpooling对四个区域进行池化操作。
最终得到2 X 2d的所需结果。

以上就是ROI pooling的操作

ROI Align详解

ROI Align是对ROI pooling中取整操作，造成的偏差的改进。

ROI pooling的取整操作:

ROI映射到feature map上，比例进行变化。但是这个比例变换不一定整数倍的变换，存在小数是就会取整操作
ROI 映射到特征层后，按照输出维度划分ROI映射区域时，划分的区域不一定是刚好划分平均（5/2 = 2.5, 所以分为2 + 3）。

主要是使用线性插值的方法，我自己只能理解，所以推荐下下面的链接。当然也可以多在网上查一查相关资料。
这是对于ROI Align的详解

你好啊：）

关注

14
点赞
踩
130

收藏

觉得还不错? 一键收藏
0
评论
【深度学习小知识】ROI到ROI pooling 再到ROI Align

ROI！RoI Pooling！ROI详解RoI Pooling详解Pooling操作ROI poolingROI Align详解ROI详解Region of interest(ROI),中文译为感兴趣区域。在计算机视觉领域，从输入的图像中框选处理待处理的区域就是ROI。ROI / Region proposals大致过程：输入一张图片在图片中找到物体/目标（objects）的所有位置输出/获得这些一系列的objects的bounding box.RoI Pooling详解Pooli
复制链接

扫一扫

专栏目录