问题:移位操作受限于移位操作(memory movement)。主要体现在计算内存较小时,如GPU。
目的:解决移位操作中,内存移动的限制。
方法:采用稀疏移位层(sparse shift layer)(较少的移位操作)构建有效的卷积神经网络。
具体做法:
1.在损失函数中给无用的移位操作添加惩罚项,去除无用的移位操作:
2.Fully-Exploited Network(FE-Net):每层部分特征图参与计算,其它特征图不参与计算而是直接当做下一层特征图。
移位操作和深度可分离卷积的比较:
shift operation | depthwise separable convolution |
和深度可分离卷积结构相同时节省运行时间 | 运行时间长 |
运行时间不受核尺寸的影响 | 运行时间受卷积核尺寸影响 |
补充知识点:
名词 | 解释 |
shift operation | (移位操作)区别于深度可分离卷积,先把原通道进行移位操作然后直接运用1x1卷积操作。 |
depthwise separable convolution | (深度可分离卷积)将传统的卷积核拆分成两部分,例如:将3x3(x3)x96的卷积核拆分成3x3(x3)不加和操作+1x1(x3)x96加和操作的卷积。 |
memory movement | (内存移动)将源内存地址的内容拷贝到目标内存地址中。 |
float point opera- tions (FLOPs) | (浮点运算)要计算的数是浮点型 |