深度网络架构

最新推荐文章于 2024-08-20 13:00:00 发布

NIGHT_SILENT

最新推荐文章于 2024-08-20 13:00:00 发布

阅读量2k

点赞数

分类专栏：网络深度学习

本文链接：https://blog.csdn.net/NIGHT_SILENT/article/details/80800867

版权

深度学习同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

网络

3 篇文章 0 订阅

订阅专栏

Rumelhart、Hinton和Williams在1986年提出了反向传播(BP)算法。

LeNet：诞生于1994年，由Yann LeCun提出。确定了卷积神经网络的 3 层序列：卷积层（Convolution）、池化层（Pooling）和非线性层（Non-linearity）。奠定了CNN的三大核心思想：局部感受野，权值共享，下采样。

Alexnet：诞生于2012年，为什么成功：imagenet、gpu（多gpu计算）、relu替代sigmoid、dropout、数据增广

Vgg：诞生于2014年，将网络加深，卷积核全部使用3*3。直观说来，最好选择带有小滤波器的卷积层组合，而不是用一个带有大的滤波器的卷积层。前者更能提取出深层的更好的特征，使用的参数也更少。唯一的不足是，在进行反向传播时，中间的卷积层可能会导致占用更多的内存。

GoogLenet：诞生于2014年，Inception系列三大基本结构：Mutiplebranches( 1x1,3x3,5x5,pool )，Shortcut( stand-alone 1x1 , merged by concat)，Bottleneck（reduce dimension by 1x1 before 3x3/5x5 conv ）。原始的Inception模型，也就是GoogLeNet被称为Inception-v1，加入batch normalization之后被称为Inception-v2，加入factorization的idea之后，改进为Inception-v3。

Resnet：深度残差网络（Deep residual network），何凯明之作。ResNet的出现是解决普通网络随着深度增加，性能反而下降的问题，造成这个问题的原因是梯度消失而非过拟合。
ResNet为什么会有如此优异的表现呢？其实ResNet是解决了深度CNN模型难训练的问题，14年的VGG才19层，而15年的ResNet多达152层，这在网络深度完全不是一个量级上，所以如果是第一眼看这个图的话，肯定会觉得ResNet是靠深度取胜。事实当然是这样，但是ResNet还有架构上的trick，这才使得网络的深度发挥出作用，这个trick就是残差学习（Residual learning）。下面详细讲述ResNet的理论及实现。

理论上，对于“随着网络加深，准确率下降”的问题，Resnet提供了两种选择方式，也就是identity mapping和residual mapping，如果网络已经到达最优，继续加深网络，residualmapping将被push为0，只剩下identity mapping，这样理论上网络一直处于最优状态了，网络的性能也就不会随着深度增加而降低了。
这里写图片描述

LeNet-5

LeNet-5模型一共有7层，下图展示了LeNet-5模型的架构：
LeNet-5模型架构
第一层，卷积层：
这一层的输入就是原始的图像像素32*32*1。第一个卷积层过滤器尺寸为5*5，深度为6，不使用全0填充，步长为1。所以这一层的输出：28*28*6，卷积层共有5*5*1*6+6=156个参数

第二层，池化层：
这一层的输入为第一层的输出，是一个28*28*6的节点矩阵。本层采用的过滤器大小为2*2，长和宽的步长均为2，所以本层的输出矩阵大小为14*14*6。

第三层，卷积层：
本层的输入矩阵大小为14*14*6，使用的过滤器大小为5*5，深度为16.本层不使用全0填充，步长为1。本层的输出矩阵大小为10*10*16。本层有5*5*6*16+16=2416个参数。

第四层，池化层：
本层的输入矩阵大小10*10*16。本层采用的过滤器大小为2*2，长和宽的步长均为2，所以本层的输出矩阵大小为5*5*16。

第五层，全连接层：
本层的输入矩阵大小为5*5*16，在LeNet-5论文中将这一层成为卷积层，但是因为过滤器的大小就是5*5，所以和全连接层没有区别。如果将5*5*16矩阵中的节点拉成一个向量，那么这一层和全连接层就一样了。本层的输出节点个数为120，总共有5*5*16*120+120=48120个参数。

第六层，全连接层：
本层的输入节点个数为120个，输出节点个数为84个，总共参数为120*84+84=10164个。

第七层，全连接层：
本层的输入节点个数为84个，输出节点个数为10个，总共参数为84*10+10=850