Pytorch搭建LeNet5

最新推荐文章于 2024-07-27 13:54:42 发布

xzw96

最新推荐文章于 2024-07-27 13:54:42 发布

阅读量1.2k

点赞数 1

分类专栏： pytorch 文章标签：神经网络卷积深度学习

本文链接：https://blog.csdn.net/qq_40630902/article/details/119454876

版权

本文介绍了LeNet5神经网络的起源、结构，并详细解析了如何使用Pytorch搭建此模型。LeNet由Yan LeCun提出，是卷积神经网络的基础，包含卷积层、最大池化层和全连接层。在Pytorch中，通过定义卷积和全连接层，结合ReLU激活函数和最大池化操作，可以实现LeNet5。

摘要由CSDN通过智能技术生成

Pytorch搭建LeNet5

1. LeNet神经网络介绍

LeNet神经网络由深度学习三巨头之一的Yan LeCun提出，他同时也是卷积神经网络 (CNN，Convolutional Neural Networks)之父。LeNet主要用来进行手写字符的识别与分类。LeNet的实现确立了CNN的结构，现在神经网络中的许多内容在LeNet的网络结构中都能看到，例如卷积层，Pooling层，ReLU层。虽然LeNet早在20世纪90年代就已经提出了，但由于当时缺乏大规模的训练数据，计算机硬件的性能也较低，因此LeNet神经网络在处理复杂问题时效果并不理想。虽然LeNet网络结构比较简单，但是刚好适合神经网络的入门学习。

2. LeNet神经网络结构
在这里插入图片描述

卷积层块里的基本单位是卷积层后接最大池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的最大池化层则用来降低卷积层对位置的敏感性。
卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用5×5的窗口，并在输出上使用ReLU激活函数。
第一个卷积层输出通道数为6，第二个卷积层输出通道数则增加到16。这是因为第二个卷积层比第一个卷积层的输入的高和宽要小，所以增加输出通道使两个卷积层的参数尺寸类似。
卷积层块的两个最大池化层的窗口形状均为2×2，且步幅为2。由于池化窗口与步幅形状相同，池化窗口在输入上每次滑动所覆盖的区域互不重叠。
卷积层块的输出形状为(批量大小, 通道, 高, 宽)。

in_put = torch.rand(1, 1, 32, 32)       # 随机构建一张一个通道的32*32的输入图片

当卷积层块的输出传入全连接层块时，全连接层块会将小批量中每个样本变平（flatten）。

- output = output.view(img.size(0), -1)

也就是说，全连接层的输入形状将变成二维，其中第一维是小批量中的样本，第二维是每个样本变平后的向量表示，且向量长度为通道、高和宽的乘积。
全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其中10为输出的类别个数。

3. Pytorch搭建LeNet5

import torch.nn as nn
from collections import OrderedDict
import torch


# 利用torch.nn.Sequential和collections.OrderedDict()来构建每一个layer
class C1(nn.Module):
    def __init__(self):
        super(C1, self).__init__()

        self.c1 = nn.Sequential(OrderedDict([    # 1代表输入通道数，6代表输出通道数，5代表卷积核的大小5x5,默认stride=1
            ('c1', nn.Conv2d(1, 6, 5)),     # 6@28×28
            ('relu1', nn.ReLU()),           
            ('s2', nn.MaxPool2d(2, 2))      # 6@14x14,通道数不变，超参数2分别表示池化大小和步长
        ]))

    def forward(self, img):
        output = self.c1(img)               # 输入是1x32x32
        return output


class C3(nn.Module):
    def __init__(self):
        super(C3, self).__init__()

        self