Selective Kernel Networks(CVPR-2019)

摘要

提出了一种动态选择机制,允许每个神经元根据输入信息的多个尺度自适应调整感受野大小。设计了一种称为选择核(SK)单元的结构块,利用softmax attention 对不同核大小的多个分支进行融合。对这些分支的不同attention产生融合层神经元有效感受野的不同大小。多个SK单元被堆叠成一个称为选择性核的网络SKNets。
文章提出了一种非线性方法,从多个内核中聚合信息,实现神经元的自适应RF大小。我们引入了 “选择性内核”(SK)卷积,它由三组运算符组成:Split, Fuse and Select。分裂运算符产生具有不同内核大小的多个路径,对应于神经元的不同RF大小。融合运算符结合并汇总来自多条路径的信息,以获得选择权重的全局和综合表示。选择运算符根据选择权重聚合不同大小的内核的特征图。
为了验证所提出的模型是否具有调节神经元感受野大小的能力,我们通过在自然图像中放大目标对象并缩小背景以保持图像大小不变来模拟刺激。研究发现,当目标对象越来越大时,大多数神经元越来越多地从较大的kernel apth中收集信息。这些结果表明,所提出的SKNet中的神经元具有自适应的RF大小,这可能是该模型在目标识别方面的优越性能的基础。
在这里插入图片描述

首先split:

对给定特征图x,用卷积核大小为3和5的卷积执行两个转换。
在这里插入图片描述
注意F都是有深度卷积、批处理规范化和relu函数按顺序组成的。为了进一步提高效率,将传统的55核卷积替换为33核卷积,dilation大小为2.

Fuse操作:

将分支中的信息通过元素求和进行融合:
在这里插入图片描述
然后通过全局平均池化来嵌入全局信息,从而生成channel-wise的信道统计信息:
在这里插入图片描述
接着建立一个紧凑的特征,使之能够进行精确的自适应选择,这通过简单的全连接层实现:
在这里插入图片描述
其中δ是ReLU函数[ 29 ],B是批归一化[ 15 ],W∈Rd × C
。为了研究d对模型效率的影响,我们使用一个折减比率r来控制它的值:
在这里插入图片描述
式中:L为d ( L = 32是我们实验中的典型设置)的最小值。

select操作

跨通道的软注意力用于自适应地选择不同空间尺度的信息,由紧凑的特征描述子z引导。具体地,在通道数字上应用softmax算子:

其中A,B分和a,b分别代表在这里插入图片描述的软注意力向量。在这里插入图片描述,是A的第c行,是a的第c个元素。在两个分支中,B是冗余的因为在这里插入图片描述,特征图V由以下在各个核上的注意力权重得到。在这里插入图片描述

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值