1.1卷积的作用

上图解释了1∗1卷积如何适用于尺寸为H∗W∗D的输入层,滤波器大小为1∗1∗D,输出通道的尺寸为H∗W∗1。如果应用n个这样的滤波器,然后组合在一起,得到的输出层大小为H∗W∗n。

1.1∗1卷积的作用

  • 调节通道数
    由于 1×1 卷积并不会改变 height 和 width,改变通道的第一个最直观的结果,就是可以将原本的数据量进行增加或者减少。这里看其他文章或者博客中都称之为升维、降维。但实际情况维度并没有改变,改变的只是 height×width×channels 中的channels这一个维度的大小而已。
  • 增加非线性
    1∗1卷积核,可以在保持特征图尺度不变的(即不改变)的前提下大幅增加非线性特性(利用后接的非线性激活函数如ReLU)。非线性允许网络学习更复杂的功能,并且使得整个网络能够进一步加深。
  • 跨通道信息交互
    使用1∗1卷积核,实现降维和升维的操作其实就是间通道信息的线性组合变化。例如:在卷积核大小为3∗3,卷积核个数为64的滤波器与卷积核大小为1∗1,卷积核个数为28的滤波器组合,其输出层大小等于通过卷积核大小为3∗3,卷积核个数为28的滤波器所得到的输出层的大小,原来的64个通道就可以理解为跨通道线性组合变成了28通道,这就是通道间的信息交互。
  • 减少参数
    前面所说的降维,其实也是减少了参数,因为特征图少了,参数也自然跟着就减少,相当于在特征图的通道数上进行卷积,压缩特征图,二次提取特征,使得新特征图的特征表达更佳。

2. 1∗1卷积的应用

Network in Network(NIN)
NIN提出了MLP卷积层,MLP卷积层通过叠加"Micro Network"网络,提高非线性表达,而其中的"Micro Network"基本组成单元是1∗1卷积网路,说到这,就要解释一下1∗1卷积了,该篇论文是首次提出1∗1卷积,具有划时代的意义,之后的GoogleNet借鉴了1∗1卷积,还专门致谢过这篇论文。

Inception
​ GoogleNet首次提出Inception模块,Inception一共有V1、V2、V3、V4四个版本(这里就不详述了)。下图为Inception V1的结构如下图两个图所示。

在充分引入1∗1卷积进行降维后如图(b)所示,总体而言相比于图(a)其卷积参数量已经减少了近4倍。
​ 在inception结构中,大量采用了1∗1卷积,主要是两点作用:a.对数据进行降维;b.引入更多的非线性,提高泛化能力,因为卷积后要经过ReLU激活函数;

ResNet

ResNet同样也利用了1∗1卷积,并且是在3∗33*3卷积层的前后都使用了,不仅进行了降维,还进行了升维,参数数量进一步减少。其中右图又称为Bottleneck Design,目的一目了然,就是为了降低参数的数目,第一个1∗1的卷积把通道量从256降到64,然后在最后通过1∗1卷积恢复,整体上用的参数数目差了近16.94倍。
​ 对于常规ResNet,可以用于34层或者更少的网络中,对于Bottleneck Design的ResNet通常用于更深的如101这样的网络中,目的是减少计算和参数量。

参考:

卷积神经网络中的1*1卷积究竟有什么用?

一文读懂卷积神经网络中的1x1卷积核

 

  • 22
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可变形卷积(deformable convolution)是一种在特征图上进行卷积操作的卷积方式,其本质上还是卷积。它通过引入可变形卷积核来适应目标物体的形状变化,从而提高模型的准确率。 可变形卷积作用对象是特征图而非原始图像,因为在卷积神经网络中,特征图是通过多层卷积和池化操作从原始图像中提取出来的,具有更好的抽象能力和语义信息。作用在特征图上的可变形卷积可以适应目标物体的形状变化,提高模型的感受野和准确率。 因此,可变形卷积并不是直接作用在原始图像上的,而是作用在特征图上的。在一些需要考虑目标物体形状变化的任务中,如目标检测和语义分割,采用可变形卷积可以有效提升模型的准确性。 ### 回答2: 可变形卷积是一种基于可变形滤波的深度学习方法,它主要作用在特征图上。在传统的卷积操作中,卷积核的权重是固定的,无法适应图像中非刚性变形的情况。而可变形卷积通过学习额外的偏移量,可以动态调整卷积核的采样位置,从而对图像中的非刚性变形进行建模。 可变形卷积的主要优势在于它可以捕捉更精细的特征信息,从而提升模型的性能。通过对图像进行可变形卷积操作,可以更好地应对图像中存在的宽度、高度和角度等非刚性变形。例如,当处理包含倾斜、拉伸、翻转等变形的图像时,传统卷积可能无法准确地捕捉到这些变形,而可变形卷积可以根据具体情况灵活地调整采样位置,从而更好地适应这些变形。 然而,可变形卷积作用在图像上可能效果不明显。这是因为可变形卷积的特点是根据特征图的内容来动态调整采样位置,而对整个图像应用可变形卷积需要较大的计算量。对于一些简单的图像,其本身可能不具备太多非刚性变形,因此应用可变形卷积可能并不会带来明显的效果提升。相对应的,对于包含大量非刚性变形的复杂图像,可变形卷积能够更好地捕捉到这些变形,因此效果会更为显著。 综上所述,可变形卷积主要作用在特征图上,可以捕捉到图像中的非刚性变形,从而提升模型性能。但对于简单的图像,作用在整个图像上可能效果不明显,而对于复杂图像的处理则能更好地发挥其优势。 ### 回答3: 可变形卷积是一种用于处理图像的卷积操作,它可以根据输入图像中的目标位置对卷积核进行形变,以更好地适应目标目标的形状变化。它的作用对象是特征图,而不是原始图像。 可变形卷积的有效性在于其对特征图进行形变,从而能够更好地捕捉目标的形状特征。相对于传统的卷积操作,可变形卷积在处理具有大形变目标的图像时具有更强的适应性。例如,在物体检测任务中,可变形卷积能够通过学习特征图中物体的变形情况,有效地提高目标的定位准确性和检测召回率。 作用在特征图上的可变形卷积能够更好地应对目标的形状变化,但其对原始图像的处理效果可能有限。因为可变形卷积主要侧重于调整卷积核的空间采样位置,而不是对原始图像进行形变。所以,如果想要在原始图像上实现形变效果,可变形卷积通常需要与其他图像处理技术相结合,才能更好地发挥作用。 综上所述,可变形卷积作用对象是特征图,通过形变卷积核以适应目标形状的变化,以提高目标检测和定位任务的性能。对于图像上的形变,可变形卷积的效果可能有限,因此可能需要结合其他图像处理方法来实现更好的形变效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值