吴恩达—卷积神经网络（CNN）学习笔记（三）——经典案例介绍

西_西_

已于 2024-06-11 09:40:39 修改

阅读量465

点赞数 8

分类专栏：深度学习文章标签： cnn 学习笔记

于 2023-12-15 20:35:50 首次发布

本文链接：https://blog.csdn.net/weixin_47414581/article/details/135024789

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

第二周课程的开始，吴教授开始讲解几个经典的CNN案例，包括LeNet-5、AlexNet、VGG、ResNets等。我认为这一部分内容还是挺有用的，至少让我对于CNN有了更直观的理解，了解这些经典架构的特点对于pytorch实现也有帮助。

1.LeNet-5

从这个经典的CNN案例中我们又可以看到随网络深度增加， nHn_{H} 、 nWn_{W} 逐渐减小而 nCn_{C} 逐渐增大的趋势，这种趋势在很多有效的CNN案例中都有体现，所以我们在设计CNN架构时同样可以采取这样的方式。

此外，CONV-POOL-CONV-POOL-FC-FC-OutPut的结构同样非常常用且有效。

对于CNN中卷积层、池化层和全连接层的作用，我们可以这样理解：

卷积层的作用是学习更能代表输入的特征
池化层是为了降低空间维度
全连接层用于类别预测

LeNet-5在CNN案例中属于比较小的网络结构，其中约有6万个参数。下面我们再看一种更大的网络结构。

2.AlexNet

图中的same指的就是Same convolution，因此前后的nH和nW不变

这个网络就明显更加复杂了，包含约6000万个参数。图中红色虚线框中是卷积网络与全连接网络之间的过渡，但其实并没有进行任何计算，只是将6×6×256个节点展开为一维而已，可以看到等号两边都是9216个节点。

3.VGG

以VGG-16为例：

图中的卷积层CONV都是用3×3大小的卷积核做步幅为1、Padding类型为Same的运算，池化层POOL都是用2×2大小的过滤器做步幅为2的最大池化。箭头下方的×n指重复n次。

可以看出这个网络的深度很高（事实上VGG-16中的16就是指网络中含有16层CONV和FC），共包含约1.38亿个参数。但是由于所用的卷积层和池化层在结构上是固定的，所以此网络没有那么多的超参数，这是一种只需要专注于构建卷积层的网络。

这里也可以看出参数和超参数的区别。

超参数是用来确定模型的一些参数，一般是根据经验和验证集效果确定的变量，超参数不同，模型是不同的。在卷积神经网络中，超参数有学习速率、迭代次数、层数、每层神经元的个数、批大小（batch size）及损失函数中各部分的权值等。而参数是可以根据模型自身的算法，通过数据迭代自动学习出的变量，如卷积核的权值w、偏置b等。