Pytorch实现LeNet

最新推荐文章于 2024-06-26 09:57:38 发布

超级无敌吉士堡

最新推荐文章于 2024-06-26 09:57:38 发布

阅读量700

点赞数

分类专栏：算法 Python

本文链接：https://blog.csdn.net/weixin_41169182/article/details/104356292

版权

本文介绍了LeNet模型，包括其卷积层和全连接层的结构。LeNet使用卷积层识别图像模式，通过平均池化层降低位置敏感性。在Fashion-MNIST数据集上的应用显示，模型虽然运行速度较慢，但能有效进行图像识别。

摘要由CSDN通过智能技术生成

文章目录

Convolutional Neural Networks
LeNet 模型介绍
LeNet 网络搭建
运用LeNet进行图像识别-fashion-mnist数据集

Convolutional Neural Networks

使用全连接层的局限性：

图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。
对于大尺寸的输入图像，使用全连接层容易导致模型过大。

使用卷积层的优势：

卷积层保留输入形状。
卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算，从而避免参数尺寸过大。

LeNet 模型介绍

LeNet分为卷积层块和全连接层块两个部分。
在这里插入图片描述卷积层块里的基本单位是卷积层后接平均池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的平均池化层则用来降低卷积层对位置的敏感性。

卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用

的窗口，并在输出上使用sigmoid激活函数。第一个卷积层输出通道数为6，第二个卷积层输出通道数则增加到16。

全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其中10为输出的类别个数。

LeNet 网络搭建

import torch
import torch.nn as nn
import torch.optim as optim
import time

#net
class Flatten(torch.nn.Module):  #展平操作
    def forward(self, x):
        return x.view(x.shape[0], -1)

class Reshape(torch.nn.Module): #将图像大小重定型
    def forward(self, x):
        return x.view(-1,1,28,28)      #(B x C x H x W)
    
net = torch.nn.Sequential(     #Lelet                                                  
    Reshape(),
    nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2), #b*1*28*28  =>b*6*28*28
    nn.Sigmoid(),                                                       
    nn.AvgPool2d(kernel_size=2, stride=2),                              #b*6*28*28  =>b*6*14*14
    nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5),           #b*6*14*14  =>b*16*10*10
    nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),                              #b*16*10*10  => b*16*5*5
    Flatten(),                                                          #b*16*5*5   => b*400
    nn.Linear(in_features=16