OctConv ：Drop an Octave: Reducing Spatial Redundancy inConvolutional Neural Networks with......

MengYa_DreamZ

于 2022-09-15 11:36:43 发布

阅读量457

点赞数 1

分类专栏：【论文研读-图像处理】文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MengYa_Dream/article/details/126868081

版权

【论文研读-图像处理】专栏收录该内容

39 篇文章 27 订阅

订阅专栏

[Paper] Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution (arxiv.org)

图像分类方向，仅作学习了解，不扩展细节。

作者认为：不仅自然世界中的图像存在高低频，卷积层的输出特征图以及输入通道（feature maps or channels）也都存在高、低频分量。低频分量支撑的是整体，比如企鹅的白色大肚皮。显然，低频分量是存在冗余的，在编码过程中可以节省。

在音乐中，Octave是八音阶的意思，隔一个八音阶，频率会减半；在这里，drop an octave就是通道尺寸减半的含义。基于以上考虑，作者提出OctConv用以取代传统CNN（vanilla CNN）。有以下两个关键步骤：

第一步，要获得输入通道（或图像）的线性尺度表示，称为Octave feature representation。

所谓高频分量，是指不经过高斯滤波的原始通道（或图像）；

所谓低频分量，是指经过t=2的高斯滤波得到的通道（或图像）。

由于低频分量是冗余的，因此作者将低频分量的通道长/宽设置为高频分量通道长/宽的一半。

Q：那么高频通道和低频通道比例是多少呢？

作者设置了一个超参数α∈[0,1]α∈[0,1]，表示低频通道的比例。
输入通道低频比例αin和输出通道低频比例αout设为相同。

Q：由于高/ 低频通道尺寸不一致，因此传统卷积无法执行。
但我们又不能简单地对低频通道进行升采样，因为相当于白干，计算量和内存就没办法节省了。
作者提出了对应的卷积解决方案：Octave Convolution。

该文通过尺度空间变换和Octave卷积操作，让网络更清晰地分开处理高、低频分量，并且在低频分量上节约了计算量。

计算过程及笔记：

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
OctConv ：Drop an Octave: Reducing Spatial Redundancy inConvolutional Neural Networks with......

一文简概核心OctConv ：Drop an Octave: Reducing Spatial Redundancy inConvolutional Neural Networks with及计算思路
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MengYa_DreamZ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。