OctConv :Drop an Octave: Reducing Spatial Redundancy inConvolutional Neural Networks with......

[Paper] Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution (arxiv.org)

图像分类方向,仅作学习了解,不扩展细节。

作者认为:不仅自然世界中的图像存在高低频,卷积层的输出特征图以及输入通道feature maps or channels)也都存在高、低频分量低频分量支撑的是整体,比如企鹅的白色大肚皮。显然,低频分量是存在冗余的,在编码过程中可以节省

在音乐中,Octave是八音阶的意思,隔一个八音阶,频率会减半;在这里,drop an octave就是通道尺寸减半的含义。基于以上考虑,作者提出OctConv用以取代传统CNN(vanilla CNN)。有以下两个关键步骤

第一步获得输入通道(或图像)的线性尺度表示,称为Octave feature representation。

所谓高频分量,是指不经过高斯滤波的原始通道(或图像)

所谓低频分量,是指经过t=2的高斯滤波得到的通道(或图像)

由于低频分量是冗余的,因此作者将低频分量的通道/设置为高频分量通道/的一半。

Q:那么高频通道和低频通道比例是多少呢

  • 作者设置了一个超参数α∈[0,1]α∈[0,1],表示低频通道的比例
  • 输入通道低频比例αin输出通道低频比例αout为相同。

Q:由于高/ 低频通道尺寸不一致,因此传统卷积无法执行。
我们又不能简单地对低频通道进行升采样,因为相当于白干,计算量和内存就没办法节省了
作者提出了对应的卷积解决方案:Octave Convolution

 该文通过尺度空间变换和Octave卷积操作,让网络更清晰地分开处理高、低频分量,并且在低频分量上节约了计算量。

计算过程及笔记:

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MengYa_DreamZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值