Octave卷积学习笔记

最新推荐文章于 2024-08-16 08:32:01 发布

无用技术研究所

最新推荐文章于 2024-08-16 08:32:01 发布

阅读量2.1k

点赞数 4

文章标签：神经网络机器学习卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44546360/article/details/89857182

版权

本文深入探讨了Octave卷积的概念，它通过分频思想降低计算量，保持信息。主要内容包括Octave卷积的原理、性能分析（计算量与参数量）以及在神经网络中的实现。实验表明，这种方法在减少计算量的同时，保持了模型性能。

摘要由CSDN通过智能技术生成

本文首发于个人博客

Octave卷积

Octave卷积的主题思想来自于图片的分频思想，首先认为图像可进行分频：

低频部分：图像低频部分保存图像的大体信息，信息数据量较少
高频部分：图像高频部分保留图像的细节信息，信息数据量较大

由此，认为卷积神经网络中的feature map也可以进行分频，可按channel分为高频部分和低频部分，如图所示：

在这里插入图片描述

对于一个feature map，将其按通道分为两个部分，分别为低频通道和高频通道。随后将低频通道的长宽各缩减一半，则将一个feature map分为了高频和低频两个部分，即为Octave卷积处理的基本feature map，使用X表示，该类型X可表示为 $X = [X^H,X^L]$ ，其中 $X^H$ 为高频部分， $X^L$ 为低频部分。

为了处理这种结构的feature map，其使用了如下所示的Octave卷积操作：

在这里插入图片描述

首先考虑低频部分输入 $X^L$ ，该部分进行两个部分的操作：

$X^L \to X^H$ ：从低频到高频，首先使用指定卷积核 $W^{L \to H}$ 进行卷积，随后进行Upample操作生成与高频部分长宽相同的Tensor，最终产生 $Y^{L\to H} = Upsample(Conv(X^L,W^{L \to H}),2)$
$X^L \to X^L$ ：从低频到低频，这个部分为直接进行卷积操作 $Y^{L \to L} = Conv(X^L,W^{L \to L})$

随后考虑高频部分，与低频部分类似有两个部分的操作：

$X^H \to X^H$ ：从高频到高频，直接进行卷积操作 $Y^{H \to H} = Conv(X^H,W^{H \to H})$
$X^H \to X^L$ ：从高频到低频，首先进行stride和kernel均为2的平均值池化，再进行卷积操作，生成与 $Y^L$ 通道数相同的feature map，最终产生 $Y^{H \to L} = conv(avgpool(X^H,2),W^{H \to L}))$

最终，有 $Y^L = Y^{H \to L} + Y^{L \to L}$ 和 $Y^H = Y^{H \to H} +Y^{L \to H}$ ，因此可以总结如下公式：
$Y^L = Y^{H \to L} + Y^{L \to L} = Y^{H \to L} = conv(avgpool(X^H,2),W^{H \to L})) + Conv(X^L,W^{L \to L}) \\ Y^H = Y^{H \to H} +Y^{L \to H} = Conv(X^H,W^{H \to H}) + Upsample(Conv(X^L,W^{L \to H}),2)$

最低0.47元/天解锁文章

无用技术研究所

关注

4
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。