目标检测之ROI Pooling层解析

最新推荐文章于 2023-03-12 23:18:20 发布

周月亮

最新推荐文章于 2023-03-12 23:18:20 发布

阅读量5.3k

点赞数 8

分类专栏：计算机视觉文章标签：目标检测

本文链接：https://blog.csdn.net/syysyf99/article/details/98471860

版权

ROI Pooling层是目标检测中的关键组件，解决了特征图尺寸不固定的问题，确保输出固定大小的特征层。该层有两个输入：固定大小的特征图和ROI矩阵。ROI是region of interests，fast RCNN中由selective search生成，faster RCNN中来自RPN。ROI Pooling通过映射、分块和最大池化操作，将不同大小的ROI转换为固定尺寸，加速训练和测试，提升检测精度。

摘要由CSDN通过智能技术生成

参考：
1
2

ROIs Pooling是Pooling层的一种，特点是输入特征图尺寸不固定，但是输出特征层尺寸固定。
ROI即region of interests，指的是特征图上的框。
在fast rcnn中，roi是指的是selective search完成之后得到的候选框在特征图上的映射。如下图：
而在faster rcnn中是在rpn之后产生的，然后再把各个候选框映射到特征图上，得到ROI。往往经过rpn之后得到的不仅仅只有一个候选框，所以一般指的是对多个ROI进行池化。
目标检测的过程可以分为如下两个阶段：
阶段一：region proposal：给定一张image找出所有object可能存在的位置，这个阶段的输出是所有object可能位置的bounding box。这些bounding box称为region proposals或者regions of interests（ROI）。
阶段二：final classification：确定上一阶段的每个region proposal是否属于某类目标或者背景类。
目标检测的这两个阶段可能存在的问题是：
（1&

最低0.47元/天解锁文章

周月亮

关注

8
点赞
踩
38

收藏

觉得还不错? 一键收藏
2
评论
目标检测之ROI Pooling层解析

参考：12ROIs Pooling是Pooling层的一种，特点是输入特征图尺寸不固定，但是输出特征层尺寸固定。ROI即region of interests，指的是特征图上的框。在fast rcnn中，roi是指的是selective search完成之后得到的候选框在特征图上的映射。如下图：而在faster rcnn中是在rpn之后产生的，然后再把各个候选框映射到...
复制链接

扫一扫

专栏目录