RPN与ROI Pooling

最新推荐文章于 2024-10-15 11:24:12 发布

嘻哈过路人

最新推荐文章于 2024-10-15 11:24:12 发布

阅读量1.6k

点赞数 2

分类专栏：目标检测文章标签：计算机视觉 python 深度学习机器学习

本文链接：https://blog.csdn.net/weixin_38132153/article/details/107914526

版权

本文介绍了Faster R-CNN网络结构中的关键组件：RPN（Region Proposal Network）和ROI Pooling。RPN通过在特征图上设置多个Anchor并进行分类与回归，生成目标候选区域。ROI Pooling则对不同尺寸的区域进行最大池化，确保输出固定尺寸的特征图，便于后续处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Faster R-CNN网络结构
在这里插入图片描述

一、RPN

在这里插入图片描述
第一条线路：在原图尺度上，设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor，哪些是没目标的negative anchor。
feature maps每一个点都有9个anchors，同时每个anchors又有可能是positive和negative，所有这些信息都保存WxHx(9*2)大小的矩阵。通过softmax获得positive anchors，相当于初步提取了检测目标候选区域box（一般认为目标在positive anchors中）。
第二条线路：通过1 * 1 * 36的滤波器，获得每个anchor的坐标的调整量，9个anchor即获得了9 * 4个坐标（中心坐标与宽和高）
RPN输出：
大小为50 * 38 * 18的positive/negative softmax分类特征矩阵
大小为 50 * 38 * 36 的regression坐标回归特征矩阵