1.空洞卷积 Atrous convolution(Dilated convolution)
kernel_size = 3*3
dialted rate 分别为1,2,4
在不增加计算量的情况下,扩大了感受野
2.1 可变性卷积 Deformable Convolutional Networks
更一般的话的空洞卷积,进一步自适应选择采样方式
效果图如下:
网络实现如下:通过网络自适应学习每个像素点的采样点的偏移量,根据偏移量进行采样然后加权求和得到feature map, 完成deformable convolution 操作。
2.2 可变性卷积 Deformable Convolution Network 2
在原有DCN的基础上,进行改进。网络不仅预测偏移量,同时还预测其对应幅度,当幅度为0时,意味着不关注当前像素点区域。
3. 非对称卷积核
出自论文《ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution Blocks》
训练到测试模型的等价转换包括:BN Fusion 和 Branch Fusion 两个步骤。
4.条形池化(strip pooling)
源自论文《Strip Pooling: Rethinking Spatial Pooling for Scene Parsing》
与传统的方形空间池化操作不同,该论文设计了条形池化思路,用于捕获细长条物体的特征
基于条形池化思想,设计了Strip Pooling Module 和 Mixed Pooling Module,嵌入到backbone网络中
SPM如下图,可以看作一种attention机制
MPM如下图,包括传统空间池化和条形池化两个子模块,分别用于捕获短距离(局部)依赖和长距离依赖,从而更好地适应于不同形状物体