SPP(spatial pyramid pooling)
在spp出来之前,所有神经网络都是要输入固定尺寸的图片,比如经常遇到的224×224,图片输入网络前都要resize到224×224,导致图片变形,其中的信息也变形了,从而限制了识别精度。而SPP和ASPP就是为了解决这个问题,它可以让网络输入原图而不必resize。空间池化层实际就是一种自适应的层,这样无论你的输入是什么尺寸,输出都是固定的(21xchannel)
SPP的显著特点是:
- 不管输入尺寸大小,SPP 可以产生固定尺寸的输出
- 使用多个不同大小的pooling窗口
- SPP 可以使用同一图像不同尺寸(scale)作为输入, 得到同样长度的池化特征。
ROI Pooling是针对RoIs的Pooling,其特点是输入特征图尺寸不固定,但是输出特征图尺寸固定。ROI Pooling的思想来自于SPPNet中的Spatial Pyramid Pooling,在