CVPR 2021 Involution: Inverting the Inherence of Convolution for Visual Recognition

最新推荐文章于 2021-10-24 17:54:38 发布

VIP文章 smile909

最新推荐文章于 2021-10-24 17:54:38 发布

阅读量2.8k

点赞数 2

分类专栏： CVPR 2021

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/smile909/article/details/115257004

版权

动机

卷积操作具有两个显著特性，即spatial-agnostic和channel-specific。

spatial-agnostic：图像所有位置都使用同一个卷积核，实现了平移不变性。但它剥夺了卷积核在不同空间位置采用不同视觉模式的能力，从而限制了卷积核提取特征的的能力。此外，它还限制了卷积的感受野，对识别小目标或者模糊图像构成了挑战。
channel-specific：每个channel都提取不同类型的特征，产生了数据冗余。这使得卷积核对于不同通道的灵活性受到限制。

方法

在这里插入图片描述

提出了Involution卷积（如上图所示），可构建用于构建新型的神经网络架构。提出的Involution结构与普通卷积完全相反。具有Spatial-Specific和Channel-Agnostic两个对称反向特性。具体地说，Involution核在空间范围上是不同的，但在通道上是共享的。由于Involution核的空间特性，如果将其参数化为Involution核等固定大小的矩阵，并使用反向传播算法进行更新，则会阻碍学习到的对Involution核在不同分辨率的输入图像之间的传输。在处理可变特征分辨率的最后，属于特定空间位置的Involution核可能仅在对应位置本身的传入特征向量的条件下作为实例生

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2021 Involution: Inverting the Inherence of Convolution for Visual Recognition

动机卷积操作具有两个显著特性，即spatial-agnostic和channel-specific。spatial-agnostic：图像所有位置都使用同一个卷积核，实现了平移不变性。但它剥夺了卷积核在不同空间位置采用不同视觉模式的能力，从而限制了卷积核提取特征的的能力。此外，它还限制了卷积的感受野，对识别小目标或者模糊图像构成了挑战。channel-specific：每个channel都提取不同类型的特征，产生了数据冗余。这使得卷积核对于不同通道的灵活性受到限制。方法提出了Invo
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。