ROI Pooling解析

ROI Pooling是Ross Girshick在fast RCNN论文中提出的,用于物体检测的池化操作。它将不同大小的ROI转换为固定大小的输出,常用于处理特征图。ROI Pooling层接收经过基础网络处理的特征图和ROI信息,通过均分ROI并进行最大值或平均值池化,得到固定尺寸的输出。此操作的输出维度不依赖于原始特征图或ROI,仅取决于ROI等分的子区域数量。
摘要由CSDN通过智能技术生成

    ROI Pooling最早由Ross Girshick在2015年的论文fast rcnn中提出,是对ROI(Region of Interest)的Pooling操作,广泛应用于物体检测的研究领域。该操作旨在对输入特征图中不同大小的ROI利用池化方法获得固定大小的输出特征图。

ROI Pooling层的输入

  1. 经过基础网络卷积和池化后的固定大小的特征图;
  2. 表示ROI信息的N*5维的矩阵,其中N表示ROI数目,纵坐标的第一列表示图片在输入特征图batch中的索引,之后四位是ROI的左上角和右下角坐标的信息。如下图表示一张图片中的ROI信息

                                                                            图1 VOC数据集中带ROI标注的图片

ROI Pooling层的操作

    将特征图中的ROI缩放到预定义的大小,如7*7的尺寸,缩放的处理流程包括:将ROI均分为等大的子区域,其数量与网络层的输出大小相同;计算每个子区域中的最大值或平均值&#

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值