基于卷积神经网络【LeNet】的【MNIST】手写数字数据集分类【Colab】

最新推荐文章于 2024-07-01 13:34:44 发布

小诸葛xiaozhuge

最新推荐文章于 2024-07-01 13:34:44 发布

阅读量691

点赞数 2

分类专栏：深度学习入门文章标签：深度学习 pytorch 人工智能

本文链接：https://blog.csdn.net/weixin_60405435/article/details/126577311

版权

深度学习入门专栏收录该内容

1 篇文章 0 订阅

订阅专栏

基于卷积神经网络LeNet的MNIST手写数字数据集分类

1.LeNet模型介绍

在这里插入图片描述

２.MNIST手写数据集介绍

50，000个训练数据
10，000个测试数据
图像大小为28*28

３.代码

import torchvision #图形库
import torch
from torch import nn 
from torch.utils.data import DataLoader #实现自由的数据读取
from torchvision import transforms #常用的图片变换，例如裁剪、旋转等；
import time

#查看pytorch版本
print(torch)

#查看是否可以使用cuda
print(torch.cuda.device_count())

#查看显卡配置
!nvidia-smi

#挂载谷歌云盘
from google.colab import drive
drive.mount("/content/drive")

import sys
sys.path.append("/content/drive/MyDrive/mnist")

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(1, 6, kernel_size=5), #卷积
            nn.MaxPool2d(kernel_size=2),   #池化
            nn.Conv2d(6, 16, kernel_size=5), #卷积
            nn.MaxPool2d(kernel_size=2),  #池化
            nn.Flatten(),
            nn.Linear(16*4*4, 120), 
            nn.Linear(120, 84),
            nn.Linear(84, 10)
        )

    def forward(self, x): 
        output = self.model(x)
        return output

train_datasets = torchvision.datasets.MNIST( # 训练数据集
    root = r'../data',
    download=True,
    train=True,
    transform=transforms.ToTensor()
)
train_dataloader = DataLoader(
    dataset=train_datasets,
    batch_size=64
)

test_datasets = torchvision.datasets.MNIST( # 测试数据集
    root = r'../data',
    train=False,
    download=True,
    transform=transforms.ToTensor()
)
test_dataloader = DataLoader(
    dataset=test_datasets,
    batch_size=64
)

from google.colab import output
output.enable_custom_widget_manager()

from google.colab import output
output.disable_custom_widget_manager()

train_datasets_size = len(train_datasets)
test_datasets_size = len(test_datasets)
print("训练集数量为：{}".format(train_datasets_size))
print("测试集数量为：{}".format(test_datasets_size))

runing_mode = "gpu" # cpu,gpu, gpus
if runing_mode == "gpu" and torch.cuda.is_available():
    print("use cuda")
    device = torch.device("cuda")
else:
    print("use cpu")
    device = torch.device("cpu")

model = LeNet()
model.to(device)

loss_fn = nn.CrossEntropyLoss() #交叉熵损失函数
loss_fn.to(device)
learning_rate = 1e-2 #学习率
optim = torch.optim.SGD(model.parameters(), lr=learning_rate) #采用小批量随机梯度下降

epoch = 10 
train_step, test_step = 0, 0
for i in range(epoch):
    print("~~~~~~~~~~~~第{}轮训练开始~~~~~~~~~~~".format(i+1))
    start = time.time()
    model.train()  #训练——————————
    for data in train_dataloader:
        imgs, targets = data
        imgs, targets = imgs.to(device), targets.to(device)
        output = model(imgs)
        loss = loss_fn(output, targets)

        optim.zero_grad() #梯度清零
        loss.backward()
        optim.step()

        train_step += 1 
        if train_step % 200 == 0: #输出训练次数
            print("第{}次训练，loss={:.3f}".format(train_step, loss.item()))
    #
    model.eval()   #测试——————————
    with torch.no_grad():
        test_loss, true_num = 0, 0
        for data in test_dataloader:
            imgs, targets = data
            imgs, targets = imgs.to(device), targets.to(device)
            output = model(imgs)
            test_loss += loss_fn(output, targets)
            true_num += (output.argmax(1) == targets).sum()
    end = time.time()
    print("第{}轮测试集上的loss:{:.3f}, 正确率为:{:.3f}%,耗时:{:.3f}".format(test_step+1, test_loss.item(), 100 * true_num / test_datasets_size, end-start))
    test_step += 1