卷积神经网络--LeNet的解释与实现

最新推荐文章于 2024-10-10 22:44:29 发布

桂渊泉树

最新推荐文章于 2024-10-10 22:44:29 发布

阅读量848

点赞数 23

分类专栏：深度学习文章标签： cnn 神经网络深度学习

本文链接：https://blog.csdn.net/qq_30904887/article/details/142617195

版权

卷积神经网络–LeNet的解释与实现

根据《动手学习深度学习》中的卷积神经网络章节记录自己的学习笔记，下面是对LeNet的学习与理解，并用pytorch进行实践

LeNet代码理解

代码：

import torch
from torch import nn

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

假设我们的输入是(1, 28, 28)的图片，框架示意图：来源于https://zh.d2l.ai/chapter_convolutional-neural-networks/lenet.html
LeNet流程图

代码理解

我们的输入是(1, 28, 28)的图片，下面开始进行每层的维度计算

输入：[1, 1, 28, 28]
nn.Conv2d: 输出是6个channels，padding=(2,2)，kernel=(5, 5)，那么输出维度为[6, 28+22-5+1, 28+22-5+1] = [1, 6, 28, 28]
nn.Sigmoid: 不改变维度，输出为[1, 6, 28, 28]
nn.AvgPool2d: kernel=(2,2),stride=(2,2), 没有padding，那么输出为[6, (28-2)/2 + 1, (28-2)/2 + 1] = [1, 6, 14, 14]
nn.Conv2d: 输出是16个channels，kernel=(5,5), 那么输出为[16, 14-5+1, 14-5+1] = [1, 16, 10, 10]
nn.Sigmoid: 不改变维度，输出为[1, 16, 10, 10]
nn.AvgPool2d: kernel=(2,2),stride=(2,2), 没有padding, 那么输出为[16, (10-2)/2 + 1, (10-2)/2 + 1] = [1, 16, 5, 5]
nn.Flatten: [1, 1655] = [1, 400]
nn.Linear: [1, 120]
10.nn.Sigmoid: 不改变维度，输出为[1, 120]
nn.Linear：[1, 84]
nn.Sigmoid: 不改变维度，输出为[1, 84]
nn.Linear：[1, 10]