关于GoogleNet中1*1卷积与多尺度同时卷积聚合的问题

最新推荐文章于 2024-05-17 09:50:40 发布

Jayden yang

最新推荐文章于 2024-05-17 09:50:40 发布

阅读量2.3k

点赞数 1

分类专栏：知识点

本文链接：https://blog.csdn.net/qq_41997920/article/details/90057566

版权

知识点专栏收录该内容

36 篇文章 6 订阅

订阅专栏

在深度神经网络中我们常常要解决随着网络的加深带来的一些梯度消失，模型退化，还有随着网络加深参数指数级增长等问题。在Inception结构中使用了1*1卷积进行降维，同时在多尺度上同时进行卷积在聚合，这么做目的是：

1. 在相同的尺寸上感受野中叠加更多的卷积，能够提取更加丰富的特征NIN（network in network 2013）。在这里说一些NIN网络中的一些内容：

采用 mlpcon 的结构来代替 traditional 卷积层；
remove 卷积神经网络最后的全连接层，采用 global average pooling 层代替；

mplconv 结构

conventional 的卷积层可以认为是linear model , 为什么呢，因为局部接收域上的每一个tile 与卷积核进行加权求和，然后接一个激活函数；它的 abstraction 的能力不够，对处理线性可分的的 concept 也许是可以的，但是更复杂的 concepts 它有能力有点不够了，所以需要引入 more potent 的非线性函数；

基于此，提出了 mlpcon 结构，它用多层的感知器（其实就是多层的全连接层）来替代单纯的卷积神经网络中的加权求和； mlpcon 指的是： multilayer perceptron + convolution;

两者的结构如下所示：其中下图的 Mlpconv 的有两层的隐含层；

说明：在mlpconv中的每一层的后面都跟着一个 ReLU激活函数；用于加入更多的nonlinearity;

在卷积神经网络中，无论是输入还是输出，不同的 feature map 之间的卷积核是不相同的；

在mlpconv中，不同的 feature map 之间的开头与能结尾之间的权值不一样，而在隐含层之间的权值是共享的；

global average pooling 结构

卷积神经网络最后的全连接层可以说作为了一个分类器，或者作为了一个 feature clustering. 它把卷积层学习到的特征进行最后的分类； intuitively, 根本不了解它是怎么工作的，它就像一个黑盒子一样，并且它也引入了很多的参数，会出现 overfitting 现象；（我认为其实最后的全接层就是一个分类器）

本文，remove掉了全连接层，使用 global average pooling 来代替；举个例子更容易说明白：假设分类的任务有100 classes，所以设置网络的最后的 feature maps 的个数为 100，把每一个feature map 看作成对应每一类的概率的相关值，然后对每一个 feature map 求平均值（即 global average pooling), 得到了 100维的向量，把它直接给 softmax层，进行分类；（其实100个数中最大值对应的类别即为预测值，之所以再送给 softmax层是为了求 loss，用于训练时求梯度）