ROI Pooling &ROI Align

最新推荐文章于 2023-07-14 15:09:26 发布

一碗白开水一

最新推荐文章于 2023-07-14 15:09:26 发布

阅读量291

点赞数

分类专栏： OBD

本文链接：https://blog.csdn.net/weixin_43859829/article/details/107514615

版权

ROI Pooling用于根据预选框位置在特征图上进行池化，常见于Fast-RCNN和Faster-RCNN。ROI Align解决ROI Pooling中因量化导致的区域不匹配问题，通过双线性内插实现连续操作，尤其适用于小目标检测的精度提升。

摘要由CSDN通过智能技术生成

在这里插入图片描述
ROI Pooling 的作用是根据预选框的位置坐标在特征图中将相应区域池化为固定尺寸的特征图，以便进行后续的分类和包围框回归操作。Fast-RCNN，Faster-RCNN中用到。
ROI Align 是在Mask-RCNN这篇论文里提出的一种区域特征聚集方式, 很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题。

如图所示，这是一个Faster-RCNN检测框架。输入一张800800的图片，图片上有一个665665的包围框(框着一只狗)。图片经过主干网络提取特征后，特征图缩放步长（stride）为32。因此，图像和包围框的边长都是输入时的1/32。800正好可以被32整除变为25。但665除以32以后得到20.78，带有小数，于是ROI Pooling 直接将它量化成20。接下来需要把框内的特征池化77的大小，因此将上述包围框平均分割成77个矩形区域。显然，每个矩形区域的边长为2.86，又含有小数。于是ROI Pooling 再次把它量化到2。经过这两次量化，候选区域已经出现了较明显的偏差（如图中绿色部分所示）。更重要的是，该层特征图上0.1个像素的偏差，缩放到原图就是3.2个像素。那么0.8的偏差，在原图上就是接近30个像素点的差别，这一差别不容小觑。

最低0.47元/天解锁文章

一碗白开水一

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ROI Pooling &ROI Align

ROI Pooling 的作用是根据预选框的位置坐标在特征图中将相应区域池化为固定尺寸的特征图，以便进行后续的分类和包围框回归操作。Fast-RCNN，Faster-RCNN中用到。ROI Align 是在Mask-RCNN这篇论文里提出的一种区域特征聚集方式, 很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题。如图所示，这是一个Faster-RCNN检测框架。输入一张800800的图片，图片上有一个665665的包围框(框着一只狗)。图片经过主干.
复制链接

扫一扫