Faster R-CNN：RPN与ROI的计算

最新推荐文章于 2023-08-09 09:43:09 发布

YaMiwan

最新推荐文章于 2023-08-09 09:43:09 发布

阅读量4.4k

点赞数 4

文章标签：深度学习计算机视觉神经网络

本文链接：https://blog.csdn.net/qq_33466954/article/details/106409526

版权

Faster R-CNN通过RPN（Region Proposal Network）改进了候选框生成，减少了计算量并提升了质量。RPN包含Anchor机制，每个位置对应9个预设框。经过卷积和全连接层，分类和回归候选框。ROI Pooling将不同大小的提案转换为固定尺寸特征向量，用于后续的分类和边框回归。在训练过程中，RPN和Fast R-CNN交替优化，共享卷积层。ROI Pooling的量化过程可能导致定位精度下降，尤其对小目标影响较大。

摘要由CSDN通过智能技术生成

Faster R-CNN使用RPN(Region Proposal Network)算法代替原来的Selective Search方法产生候选框（RPN层放在最后一个卷积层的后面），且产生候选框的CNN网络和目标检测的CNN网络是同一个CNN网络。这使得候选框的数目从原有的约2000个减少为300个，且建议框的质量也有本质的提高。

Faster R-CNN的结构主要分为三大部分：
第一部分是共享的卷积层-backbone，第二部分是候选区域生成网络-RPN，第三部分是对候选区域进行分类的网络-classifier。RPN与classifier部分均对目标框有修正。classifier部分就是Fast R-CNN结构。
在这里插入图片描述
前面的CNN网络不一定要是VGG，也可以用5层CNN网络的ZFNet。
RPN层（Region Proposal Network，区域生成网络）：
Anchor：
Anchor实际上指的是预先设置好长宽比与面积的候选框。但是这种候选框产生的机制与Selective Search算法不一样。在论文中，作者为每一个位置生成9种anchor，包含三种面积(128×128，256×256，512×512)，每种面积又包含三种长宽比(1:1，1:2，2:1)。在这里插入图片描述
原始图像先进入CNN网络后在最后一个卷积层（RPN层的前一个卷积层）输出了256个通道的fea

最低0.47元/天解锁文章

YaMiwan

关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
Faster R-CNN：RPN与ROI的计算

Faster R-CNN使用RPN(Region Proposal Network)算法代替原来的Selective Search方法产生候选框（RPN层放在最后一个卷积层的后面），且产生候选框的CNN网络和目标检测的CNN网络是同一个CNN网络。这使得候选框的数目从原有的约2000个减少为300个，且建议框的质量也有本质的提高。Faster R-CNN的结构主要分为三大部分：第一部分是共享的卷积层-backbone，第二部分是候选区域生成网络-RPN，第三部分是对候选区域进行分类的网络-classif
复制链接

扫一扫