吴恩达CNN学习笔记之LeNet-5、AlexNet、VGG-16架构初探

最新推荐文章于 2023-06-20 11:13:05 发布

皮皮鲁与鲁西西�

最新推荐文章于 2023-06-20 11:13:05 发布

阅读量398

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_44398263/article/details/104534068

版权

最近在看吴恩达系列的深度学习课程，就用CSDN记录一下我的学习笔记吧，供自己后续查阅以及分享给大家。

LeNet - 5 网络

LeNet-5网络结构

AlexNet网络结构

输入层：图像大小为 227×227×3，其中 3 表示输入图像的 channel 数（R，G，B）为 3。
卷积层：filter大小11✖11✖3，s=4，个数为96个
池化层：filter为3✖3，s= 2，采用最大池化
卷积层：filter 大小 5×5，个数 256，步长 s=1，padding 使用
same，使得卷积层输出图像和输入图像在宽和高上保持不变
（另外有valid、full，具体可参考padding的三种模式）
池化层：max pooling，filter 大小 3×3，步长 s=2
卷积层：filter 大小 3×3，filter 个数 384，步长 s=1，padding 使用 same
卷积层：filter 大小 3×3，filter 个数 384，步长 s=1，padding 使用 same
卷积层：filter 大小 3×3，filter 个数 256，步长 s=1，padding 使用 same
池化层：max pooling，filter 大小 3×3，步长 s=2；池化操作结束后，将大小为 6×6×256 的输出矩阵排列成一个9216 维的向量。
全连接层：neuron 数量为 4096。
全连接层：neuron 数量为 4096。
全连接层，输出层：softmax 激活函数，neuron 数量为 1000，代表 1000 个类别。

VGG网络

VGG-16 大约有 13800w（138M）个参数。
VGG-16 中所有卷积层 filter 宽和高都是 3，步长为 1，padding 都使用 same
，所有池化层的 filter 宽和高都是 2，步长都是 2，采用的都是最大池化

关注