介绍
ROI(Region of Interest) Pooling是Pooling的一种。在传统CNN中,Pooling层的作用主要有三个:
1、特征不变性,使模型更加关注是否存在某些特征而不是特征具体的位置,对于一些旋转和平移具有不变性
2、特征降维,使模型可以抽取更广泛围的特征,减小了下一层输入大小,进而减小计算量和参数个数
3、在一定程度防止过拟合,更方便优化
ROI Pooling是针对RoIs的Pooling,其特点是输入特征图尺寸不固定,但是输出特征图尺寸固定。
在Fast RCNN中, RoI是指Selective Search完成后得到的“候选框”在特征图上的映射
在Faster RCNN中,候选框是经过RPN产生的,然后再把各个“候选框”映射到特征图上,得到RoIs
ROI Pooling的思想来自于SPPNet中的Spatial Pyramid Pooling,在Fast RCNN中使用时,将SPPNet中多尺度的池化简化了为单尺度。
SPP(Spatial Pyramid Pooling)
在介绍ROI Pooling之前,先简单介绍一下SPP的过程,两者的目的都是将不同大小的窗口输入得到同样大小的窗口输出。
在卷积的操作中,对输入的尺寸是没有限制的,但是大多数网络结构的卷积操作后会连着全连