ROIPooling和ROIAlign作用:为了使得检测网络可以输入任意size的图片,使用ROIPooling在网络中某一个阶段将不同尺度的图片ROI pooling成相同的尺度,使得fc的存在也无法限制输入图片的size。(神经网络中,限制输入图像size的是全连接层或者叫top 层)
ROIPooling:方法:直接Pooling,若尺寸不对应则直接取整,由于 RoIPooling 采用的是 INTER_NEAREST(即最近邻插值) ,在resize时,对于 缩放后坐标不能刚好为整数 的情况,采用了 粗暴的舍去小数,相当于选取离目标点最近的点,损失一定的空间精度。
例如:一张图片输入VGG16,则得到的尺寸缩小为1/32,如下图中,图片大小为800,则恰好为25,但区域块大小为665经过VGG后则为20.78,则直接处理为20,再通过ROIPooling(即,将所有不同的尺寸全部Pooling处理为相同的大小)处理为77,则20/7–> 2,由下图可知,Pooling之后存在一定的位置偏移。
具体计算:下图为一张88的feature map,选取其中一个57的region输入ROIPooling输出22的结