- 待解决的问题:CNN在计算机视觉任务上表现非常好。有效的感受野大小是CNN最关键的框架元素之一,不过它必须手动设置去适应特定的任务。标准的解决方法包括大的卷积核,下/上采样和扩展卷积。而这些都需要测试不同的扩展率和下/上采样因子,这会导致生成不紧凑的表征和过多的参数。
- 解决思路:本文提出一个由displaced aggregation units(DAU)组成的卷积滤波器。DAUs学习空间位移,并使单个卷积滤波器适应给定的问题,因此消除了手工修改的必要。实验证明,在AlexNet,ResNet50,ResNet101,DeepLab和SRN-DeburNet上,DAUs可以无缝替代这些架构里的卷积滤波器。同时,实验证明这个设计思路在图像分类,语义分割和图像去模糊上都表现得非常好。结果表明,DAUs能够有效地分配参数,从而使得在相似或者更好的表现情况下能实现高达四倍的紧凑网络。
引言
简单介绍了形变卷积(deformable convolution),扩展卷积(dilated convolutions),atrous spatial pyramid pooling(ASPP)。这些都需要预先设定固定的参数,比如扩展率,会导致次优化问题。
本文的贡献:提出了DAUs,在深度网络里引入了三个新的设计概念。它们将参数计数和感受野大小解耦;能够学习到网络里每个卷积滤波器的感受野大小;能够调整在前一层子特征上的空间焦点,从而避免了手工制作卷积滤波器的这种模式。由此产生的DAU-CNNs具有紧凑性,能有效地使用参数,并且可以在不需要手动测试不同的扩展率和滤波器的情况下去适应特定的任务。
讨论和结论