空间金字塔池化层
这个层放在最后的卷积层和全连接层之间
在conv5层得到的特征图是256层,每层都做一次spatial pyramid pooling。先把每个特征图分割成多个不同尺寸的网格,比如网格分别为
4
∗
4
、
2
∗
2
、
1
∗
1
4*4、2*2、1*1
4∗4、2∗2、1∗1,然后每个网格做max pooling,
这样256层特征图就形成了
16
∗
256
,
4
∗
256
,
1
∗
256
16*256,4*256,1*256
16∗256,4∗256,1∗256维特征,他们连起来就形成了一个固定长度的特征向量,将这个向量输入到后面的全连接层。
(注:图里边的d是维的意思,表示单位)