Octave卷积学习笔记

本文深入探讨了Octave卷积的概念,它通过分频思想降低计算量,保持信息。主要内容包括Octave卷积的原理、性能分析(计算量与参数量)以及在神经网络中的实现。实验表明,这种方法在减少计算量的同时,保持了模型性能。
摘要由CSDN通过智能技术生成

本文首发于个人博客

Octave卷积

Octave卷积的主题思想来自于图片的分频思想,首先认为图像可进行分频:

  • 低频部分:图像低频部分保存图像的大体信息,信息数据量较少
  • 高频部分:图像高频部分保留图像的细节信息,信息数据量较大

由此,认为卷积神经网络中的feature map也可以进行分频,可按channel分为高频部分和低频部分,如图所示:

在这里插入图片描述

对于一个feature map,将其按通道分为两个部分,分别为低频通道和高频通道。随后将低频通道的长宽各缩减一半,则将一个feature map分为了高频和低频两个部分,即为Octave卷积处理的基本feature map,使用X表示,该类型X可表示为 X = [ X H , X L ] X = [X^H,X^L] X=[XH,XL],其中 X H X^H XH为高频部分, X L X^L XL为低频部分。

为了处理这种结构的feature map,其使用了如下所示的Octave卷积操作:

在这里插入图片描述

首先考虑低频部分输入 X L X^L XL,该部分进行两个部分的操作:

  • X L → X H X^L \to X^H XLXH:从低频到高频,首先使用指定卷积核 W L → H W^{L \to H} WLH进行卷积,随后进行Upample操作生成与高频部分长宽相同的Tensor,最终产生 Y L → H = U p s a m p l e ( C o n v ( X L , W L → H ) , 2 ) Y^{L\to H} = Upsample(Conv(X^L,W^{L \to H}),2) YLH=Upsample(Conv(XL,WLH),2)
  • X L → X L X^L \to X^L XLXL:从低频到低频,这个部分为直接进行卷积操作 Y L → L = C o n v ( X L , W L → L ) Y^{L \to L} = Conv(X^L,W^{L \to L}) YLL=Conv(XL,WLL)

随后考虑高频部分,与低频部分类似有两个部分的操作:

  • X H → X H X^H \to X^H XHXH:从高频到高频,直接进行卷积操作 Y H → H = C o n v ( X H , W H → H ) Y^{H \to H} = Conv(X^H,W^{H \to H}) YHH=Conv(XH,WHH)
  • X H → X L X^H \to X^L XHXL:从高频到低频,首先进行stride和kernel均为2的平均值池化,再进行卷积操作,生成与 Y L Y^L YL通道数相同的feature map,最终产生 Y H → L = c o n v ( a v g p o o l ( X H , 2 ) , W H → L ) ) Y^{H \to L} = conv(avgpool(X^H,2),W^{H \to L})) YHL=conv(avgpool(XH,2),WHL))

最终,有 Y L = Y H → L + Y L → L Y^L = Y^{H \to L} + Y^{L \to L} YL=YHL+YLL Y H = Y H → H + Y L → H Y^H = Y^{H \to H} +Y^{L \to H} YH=YHH+YLH,因此可以总结如下公式:
Y L = Y H → L + Y L → L = Y H → L = c o n v ( a v g p o o l ( X H , 2 ) , W H → L ) ) + C o n v ( X L , W L → L ) Y H = Y H → H + Y L → H = C o n v ( X H , W H → H ) + U p s a m p l e ( C o n v ( X L , W L → H ) , 2 ) Y^L = Y^{H \to L} + Y^{L \to L} = Y^{H \to L} = conv(avgpool(X^H,2),W^{H \to L})) + Conv(X^L,W^{L \to L}) \\ Y^H = Y^{H \to H} +Y^{L \to H} = Conv(X^H,W^{H \to H}) + Upsample(Conv(X^L,W^{L \to H}),2) YL=YHL+YLL=YH

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值