Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution
降八度:使用八倍卷积降低卷积神经网络的空间冗余
论文地址:https://arxiv.org/pdf/1904.05049.pdf
论文由Facebook,新加坡国立大学,奇虎360合作
在天然的图像里,信息往往被表现成不同的频率,其中高频信息常被编码成精琢细节,低频嘻嘻常被编码成结构概况。相似地,一个卷积层的输出特征图谱也可以被看作是不同频率信息的整合。(卷积经常是把两个信号像绳索一样拧成一股)
本论文旨在根据频率来分解特征图谱,并且设计一个新型的八倍卷积神经网络OctConv操作来存储和处理低分辨率的特征图谱,降低了内存和计算成本。
不同于已有的大规模解决方案,OctConv被编写成单一、泛型、即插即玩的卷积单元,并且可被直接用来替代原本的卷积单元而不用调整任何网络结构。并且她可以与其他方法一起使用(交错或者补充的)以得到更好的效果或者降低卷积层之间通道的冗余。
该论文的方法已被实验证明可以仅在代替其他卷积单元的情况下稳定提高图片和视频识别任务的预测准确率,同时降低了内存和计算成本。 ResNet-152(OctConv)+ImageNet = 82.9% accuracy + 22.2 GFLOPs