SPP Layer
SPP layer 是Kaiming He组在ECCV2014年的《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》这篇文章中提出的一种空间结构下采样方法。
Caffe把该网络层结构加进来自己的平台中。下面我介绍下SPP结构的内容:
message SPPParameter {
enum PoolMethod {
MAX = 0;
AVE = 1;
STOCHASTIC = 2;
} //caffe提供了3种下采样方法,分别是最大值,均值和随机下采样
optional uint32 pyramid_height = 1; // 设置金字塔结构高度
optional PoolMethod pool = 2 [default = MAX]; // 下采样方法,默认为MAX
enum Engine {
DEFAULT = 0;
CAFFE = 1;
CUDNN = 2;
} // caffe对特殊层提供多个引擎,有三种,一种是默认,第二种是caffe实现,最后是用cudnn加速引擎
optional Engine engine = 6 [default = DEFAULT];
}
SPP对于任意大小的特征图,空间金字塔下采样得到的特征维度是固定的。M维特征只跟空间金字塔的level数有关。最后得到的特征是前一层的滤波器个数k乘上M维。即kM-dimensions feature map
.