本文考虑了N×1和1×M的狭长形状的池化核。
本文主要贡献:
1)引入了一个新的strip pooling模块,使backbone网络能够有效地模拟long-range依赖关系;
2)提出了一种以多种空间池化为核心的新型模块MPM,并构建了SPNet;
3)系统地比较了所提出的strip pooling和传统Spatial pooling技术的性能;
网络结构
1.Strip pooling(SPM)
如图所示,分别用H×1和1×W的条形池化核进行操作。利用扩展卷积将结果扩充为H×W大小,将对应位置的值相加。再将原始的数据和sigmoid后的数据对应元素相乘得到输出。
这里模块的前后分别还有一个1×1的卷积核,作用就是改变通道数,结构类似于bottleneck。
2.MPM(Mixed Pooling Module)
融合池模块将条纹池化和空间池化的结果串联起来作为输出,本模块前后同样也都有一个1x1的卷积核用来改变通道数量。图(a)适用于识别短距离依赖,图(b)适用于长距离依赖,将两者结合起来识别效果更好。(1)和(2)中除了子模