深度学习知识八：深度学习里神奇的1*1卷积核

最新推荐文章于 2024-05-07 12:34:55 发布

yangdeshun888

最新推荐文章于 2024-05-07 12:34:55 发布

阅读量3.1k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangdashi888/article/details/78032387

版权

深度学习专栏收录该内容

86 篇文章 3 订阅

订阅专栏

深度学习里神奇的1*1卷积核

这里主要介绍下1*1卷积核的神奇之处核最好的使用范围，在开始之前需要了解下卷积网络的权值共享概念，其中权值共享基本上有两种方法：

在同一特征图和不同通道特征图都使用共享权值，这样的卷积参数是最少的，例如上一层为303040，当使用33120的卷积核进行卷积时，卷积参数为：33120个.(卷积跟mlp有区别也有联系一个神经元是平面排列，一个是线性排列)
第二种只在同一特征图上使用共享权值，根据上面的例子，则卷积参数为：3340*120.

##1*1卷积核主要作用：

实现跨通道的交互和信息整合（具有线性修正特性，实现多个feature map的线性组合，可以实现feature map在通道个数上的变化，想象成跨通道的pooling，(输入的多通道的feature map和一组卷积核做卷积求和得到一个输出的feature map)
在pooling层后面加入的1×1的卷积也是降维，使得最终得到更为紧凑的结构，虽然有22层，但是参数数量却只是alexnet的1/12.
最近大热的MSRA的resnet也利用了1×1的卷积，并且是在3×3卷积层的前后都使用了，不仅进行了降维，还进行了升维，使得卷积层的输入和输出的通道数都减小，数量进一步减少。如果1×1卷积核接在普通的卷积层后面，配合激活函数，就可以实现network in network的结构了。
还有一个很重要的功能，就是可以在保持feature map尺度不变的（即不损失分辨率）的前提下大幅增加非线性特性（利用后接的非线性激活函数），把网络做的很deep。（平均池化是针对每个feature map的平均操作，没有通道间的交互，而1×1卷积是对通道的操作，在通道的维度上进行线性组合）
例子：
进行降维和升维引起人们重视的（可能）是在GoogLeNet里。对于每一个Inception模块（如下图），原始模块是左图，右图中是加入了1×1卷积进行降维的。虽然左图的卷积核都比较小，但是当输入和输出的通道数很大时，乘起来也会使得卷积核参数变的很大，而右图加入1×1卷积后可以降低输入的通道数，卷积核参数、运算复杂度也就跟着降下来了。以GoogLeNet的3a模块为例，输入的feature map是28×28×192，3a模块中1×1卷积通道为64，3×3卷积通道为128,5×5卷积通道为32，如果是左图结构，那么卷积核参数为1×1×192×64+3×3×192×128+5×5×192×32，而右图对3×3和5×5卷积层前分别加入了通道数为96和16的1×1卷积层，这样卷积核参数就变成了1×1×192×64+（1×1×192×96+3×3×96×128）+（1×1×192×16+5×5×16×32），参数大约减少到原来的三分之一。同时在并行pooling层后面加入1×1卷积层后也可以降低输出的feature map数量，左图pooling后feature map是不变的，再加卷积层得到的feature map，会使输出的feature map扩大到416，如果每个模块都这样，网络的输出会越来越大。而右图在pooling后面加了通道为32的1×1卷积，使得输出的feature map数降到了256。GoogLeNet利用1×1的卷积降维后，得到了更为紧凑的网络结构，虽然总共有22层，但是参数数量却只是8层的AlexNet的十二分之一（当然也有很大一部分原因是去掉了全连接层）。

最近大热的MSRA的ResNet同样也利用了1×1卷积，并且是在3×3卷积层的前后都使用了，不仅进行了降维，还进行了升维，使得卷积层的输入和输出的通道数都减小，参数数量进一步减少，如下图的结构。（不然真不敢想象152层的网络要怎么跑起来TAT）
这里写图片描述

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
深度学习知识八：深度学习里神奇的1*1卷积核

深度学习里神奇的1*1卷积核这里主要介绍下1*1卷积核的神奇之处核最好的使用范围，在开始之前需要了解下卷积网络的权值共享概念，其中权值共享基本上有两种方法：在同一特征图和不同通道特征图都使用共享权值，这样的卷积参数是最少的，例如上一层为30*30*40，当使用3*3*120的卷积核进行卷积时，卷积参数为：3*3*120个.(卷积跟mlp有区别也有联系一个神经元是平面排列，一个是线性排列)第二种只
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。