最近想弄透faster rcnn,觉得spp应该是非常重要的,先详细总结下:
为什么会有spp
先看下和传统分类的对比图
解释:可以看到传统的操作是先将原图crop(裁剪/变换,也就是类似resize操作),直接送入卷积层,然后进入全连接分类。那么问题就来了,随便一张图目标物体位置和大小不一样,crop肯定会影响特征的准确性啊,但是不crop成统一大小,提取的特征图大小就不一样,没法送进全连接层,那有没有可能不crop直接得到固定维度的特征图呢?ok,这就是spp作用,加入spp之后就不需要提前crop,直接任意图片送进来,把spp核心放在卷积层和全连接层之间就搞定了!
spp具体结构是咋样的?
解释:
上图就是spp结构,从下往上看,第一步卷积提取特征图,第二步金字塔池化,第三步将池化结果送入全连接层。第二步具体啥样子,就是把原来的特征图分别分成44=16块,22=4块,11=1块(不变),总共21块,取每块的最大值作为代表,即每张特征图就有21维的参数&#