目标检测学习笔记(二):RoI 池化层

本文介绍了RoI池化层在Fast R-CNN中的应用,该层能将不同大小的Region of Interest转换为固定尺寸的特征图,加速目标检测的运行速度。RoI池化层是SPP层的特例,解决了输入尺寸不一的问题,确保特征图可以进入全连接层。Fast R-CNN使用预训练的VGG16网络,将最后一层最大池化层替换为RoI池化层,用于提取RoI的类别和边界框信息。
摘要由CSDN通过智能技术生成

原文参考:Fast R-CNN

Region of Interest, RoI 池化层的概念是最早在 Ross Girshick 的文章中提出,其功能是能够将映射在卷积特征图上的不同大小的 RoI,提取相同大小的特征图(feature map)。

在文章 Fast R-CNN 中,作者采用基于 ImageNet 数据集训练的三个网络作为 Fast R-CNN 的初始化网络结构。

  • 初始化网络中具有5个最大池化层(max pooling layer),以及5到13层卷积层,在初始化网络时,将最后一层 max pooling 用 RoI pooling 进行替换,并且该池化层得到的特征图的大小 H×W 应该与之后的第一层全连接层的大小相匹配(例如,在 VGG16 网络中,H=W=7);
  • 其次,将初始化网络中最后的全连接层采用两个网络结构(1个全连接层 + Softmax)进行替代,分别用于输出 RoI 中目标的类别和相应的拟合坐标(bounding box);
  • 此外,将输入网络的数据,更改为若干图片以及每个图片中相应的 RoI(等同于 Region Proposal Network, RPN 中的 Proposal bounding boxes)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值