1×1卷积核的作用

问题:

  平时论文里经常会看到在网络里面加入1×1的卷积核,那么1×1卷积到底有什么用?其实1×1卷积与其他卷积没有什么不同,实际上就是一个简单的线性叠加。它具有和其它卷积核类似的作用,以下将详细列举。
  关键词:1×1卷积


一、实现跨通道的信息交互和整合:

  如何理解跨通道的信息交互和整合呢?首先还得从三维卷积的计算开始。
在这里插入图片描述
  如图所示,蓝色部分是一个7×7×n(维数)的Feature map,黄色块为3×3×3的卷积核,将卷积核对应到蓝色特征中可以得到一个红色阴影区域,举个具体的例子:假设卷积核所有的参数都为1。
在这里插入图片描述
  那么红色部分的数值=1×1+4×1+3×1+2×1+0×1+4×1+6×1+2×1+9×1+8×1+7×1+4×1+7×1+5×1+1×1+3×1+1×1+4×1+9×1+4×1+3×1+2×1+0×1+1×1+6×1+1×1+7×1+1×1=103
  紧接着将红色阴影区域向右移动一个单位计算下一个数值,并依次记录下来,得到一个新的特征层(即绿色部分所示),可以发现绿色部分的尺寸变小了,如果需要保持特征尺度不变,这个可以进行padding操作,即在外圈补充数值,可以补0也可以补1,以达到保持特征尺寸不变的目的。
  对于1×1×n大小的卷积核,经过上述的计算方法,可以把n个维度上的数字信息线性组合起来,因此它实现了跨通道(跨维度)的信息交互和整合。

二、降维或升维


  根据卷积核的卷积次数,也可以认为是filter的个数,因为一个卷积核就代表一个filter,进行n次卷积就代表了执行n次滤波操作。完整的执行一轮卷积后会得到一个新的feature map,将这n个feature map堆叠起来(这里可以想象成一个搭积木的过程),这样就可以得到一个n维的特征。降维或升维的过程可由下图清晰的表述。(图源自网络,侵删)
在这里插入图片描述
  图左是完整执行了两次滤波操作后的结果,图右是完整执行了四次滤波的结果。其中降维的好处就是减少计算量,下面可以用一个例子来证明:
图一
图二
  上图为未进行1×1卷积操作的结果,下图为执行了1×1卷积操作的结果,可以发现他们最终得到的特征都是30×40×55,但是他们的乘法计算量却相差很大。
  上图的乘法计算量=5×5×200×(30×40)×55(个)=330000000
  而下图的乘法计算量是1×1×200×(30×40)×20(个)+5×5×20×(30×40)×55(个)=37800000
  可以发现37800000/330000000=0.114545…,增加1*1卷积后显著减少了计算量。这种结构也称为瓶颈结构可能有人会问:这样子大幅度的缩小模型的规模会不会影响到网络的性能?其实很多学者在论文中都用事实证明了,只要合理构建瓶颈结构,既可以显著缩小模型规模,又不会降低网络的性能,从而大量减少了计算,加快模型收敛。

三、增加非线性特性:

  1×1的卷积核,可以在保持feature map尺度不变的(即不损失分辨率)的前提下大幅增加非线性特性(利用后接的非线性激活函数),把网络做的很deep。
  Tip:一个filter对应卷积后得到一个feature map,不同的filter(不同的weight和bias),卷积以后得到不同的feature map,提取不同的特征。

四、放在网络的最后可以当成全连接层来理解

图源自网络,侵删
  如图所示,b1=a1×w1+a2×w2+…+a6×w6,b1的数值就相当于文中开篇图中红色小立方体位置处的数值。这样一来,全连接的过程就相当于执行1×1卷积的过程了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值