【CVPR2021】Decoupled dynamic filter networks

计算机科研狗@OUC

已于 2022-02-07 16:08:04 修改

阅读量1.7k

点赞数 2

分类专栏：论文推介文章标签：深度学习计算机视觉 cnn

于 2022-01-18 21:39:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaopursuit/article/details/122568921

版权

论文推介专栏收录该内容

76 篇文章 14 订阅

订阅专栏

论文：https://thefoxofsky.github.io/files/ddf.pdf
代码：https://github.com/thefoxofsky/ddfnet
主页：https://thefoxofsky.github.io/project_pages/ddf

先从论文首页的图说起。第一行为普通静态卷积，对于道路、车辆、建筑使用相同的卷积核，这样会导致一个问题：sub-optimal feature learning。第二行为动态卷积，每一个像素都使用不同的卷积核，道路、车辆、建筑使用的卷积核就不一样了，有助于特征学习。但是会引入一个新的问题：参数量大大增加。

可以看出，动态卷积的参数量从普通静态卷积的 ( $\times c \times k \times k$ ) 提升为 ( $\times c \times k \times k \times h \times w$ )，参数量显著增加，计算复杂。为了降低计算量，作者提出了解耦的思路，把 ( $\times h \times w$ ) 分解成 ( $\times w + c$ )，即先计算空间位置的动态卷积，再计算通道上的动态卷积。
在这里插入图片描述
如图所示，包含两个步骤：

在 spatial 维度上，首先用 1x1 的卷积将 channel 数变成 $k^2$ ，reshape后，就是每个空间位置上的卷积核，参数量是 $k\times k \times h \times w$
在 channel 维度上，通过 GAP + SE 操作，每个 channel 得到一个 $k^2$ 向量，即每个 channel 分配一个卷积核，参数量是 $k\times k \times c$ 。

好的，终极问题来了？每个空间位置上有一个卷积核，每个 channel 上有一个卷积核，如何把卷积核作用到 $(c, h, w)$ 的三维矩阵中的每个像素上？

具体方法是： 每个像素点，找到与它 对应位置的卷积核 和 对应通道的卷积核 ，这两个卷积核进行 逐像素相乘 ，得到新的卷积核再对这个点进行卷积

论文中还有一个点值得注意，为了提升性能，卷积核归一化时，作者设计了一个 Filter-Norm，性能会优于使用 Batch-Norm 和 Sigmoid，具体可以参考作者实验，不再多说。

计算机科研狗@OUC

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
6
评论
【CVPR2021】Decoupled dynamic filter networks

论文：https://thefoxofsky.github.io/files/ddf.pdf代码：https://github.com/thefoxofsky/ddfnet主页：https://thefoxofsky.github.io/project_pages/ddf先从论文首页的图说起。第一行为普通静态卷积，对于道路、车辆、建筑使用相同的卷积核，这样会导致一个问题：sub-optimal feature learning。第二行为动态卷积，每一个像素都使用不同的卷积核，道路、车辆、建筑使用..
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。