365天深度学习-P1：实现mnist手写数字识别

weixin_41434881

已于 2024-07-20 12:42:40 修改

阅读量1.4k

点赞数 20

文章标签：深度学习人工智能

于 2024-07-19 18:18:07 首次发布

本文链接：https://blog.csdn.net/weixin_41434881/article/details/140556051

版权

>- **🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg) 中的学习记录博客**
>- **🍖 原作者：[K同学啊](https://mtyjkh.blog.csdn.net/)**

前言

第P1周：实现mnist手写数字识别
1.了解Pytorch，并使用Pytorch构建一个深度学习程序
2.了解什么是深度学习

拔高
1.学习文中提到的函数方法

实验环境
● 语言环境：Python3.9
● 编译器：Jupyter Lab
● 深度学习环境：
○ torch == 2.3.0
○ torchvision == 0.18.1

一、前期准备

1.环境配置

设备不支持GPU，只能用CPU

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision

# 设置硬件设备，如果有GPU则使用，没有则使用cpu
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

输出：

device(type='cpu') # 使用的是CPU

作为一个小白真的很迷茫，走了不少弯路，这篇文章真的是帮了大忙

【超详细教程】2024最新Pytorch安装教程（同时讲解安装CPU和GPU版本）https://blog.csdn.net/Little_Carter/article/details/135934842

2.导入数据

使用dataset下载MNIST数据集，并划分好训练集与测试集

train_ds = torchvision.datasets.MNIST('data', 
                                      train=True, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

test_ds  = torchvision.datasets.MNIST('data', 
                                      train=False, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

使用dataloader加载数据，并设置好基本的batch_size

batch_size = 32

train_dl = torch.utils.data.DataLoader(train_ds, 
                                       batch_size=batch_size, 
                                       shuffle=True)

test_dl  = torch.utils.data.DataLoader(test_ds, 
                                       batch_size=batch_size)

# 取一个批次查看数据格式
imgs, labels = next(iter(train_dl))
imgs.shape # 数据的shape为：[batch_size, channel, height, weight]
# batch_size为自己设定，channel，height和weight分别是图片的通道数，高度和宽度。

输出：

torch.Size([32, 1, 28, 28])

3.数据可视化

import numpy as np

 # 指定图片大小，图像大小为20宽、5高的绘图(单位为英寸inch)
plt.figure(figsize=(20, 5)) 
for i, imgs in enumerate(imgs[:20]):
    # 维度缩减
    npimg = np.squeeze(imgs.numpy())
    # 将整个figure分成2行10列，绘制第i+1个子图。
    plt.subplot(2, 10, i+1)
    plt.imshow(npimg, cmap=plt.cm.binary)
    plt.axis('off')
    
#plt.show()  如果你使用的是Pycharm编译器，请加上这行代码

二、构建简单的CNN网络

import torch.nn.functional as F

num_classes = 10  # 图片的类别数

class Model(nn.Module):
     def __init__(self):
        super().__init__()
         # 特征提取网络
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3)  # 第一层卷积,卷积核大小为3*3
        self.pool1 = nn.MaxPool2d(2)                  # 设置池化层，池化核大小为2*2
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3) # 第二层卷积,卷积核大小为3*3   
        self.pool2 = nn.MaxPool2d(2) 
                                      
        # 分类网络
        self.fc1 = nn.Linear(1600, 64)          
        self.fc2 = nn.Linear(64, num_classes)
     # 前向传播
     def forward(self, x):
        x = self.pool1(F.relu(self.conv1(x)))     
        x = self.pool2(F.relu(self.conv2(x)))

        x = torch.flatten(x, start_dim=1)

        x = F.relu(self.fc1(x))
        x = self.fc2(x)
       
        return x

加载并打印模型

from torchinfo import summary
# 将模型转移到GPU中（我们模型运行均在GPU中进行）
model = Model().to(device)

summary(model)

这个地方总是崩溃弹出 Kernel Restarting. The kernel appreas to have died.

参考了这篇文章在jupyter notebook运行matplotlib.pyplot内核挂掉_jupyter notebook使用matplotlib内核挂掉-CSDN博客

在虚拟环境中设置KMP_DUPLICATE_LIB_OK=TRUE。具体方法为

激活虚拟环境

activate envi_name

设置环境变量

set KMP_DUPLICATE_LIB_OK=TRUE

退出虚拟环境
deactivate

重新激活虚拟环境

activate envi_name

查看环境变量

echo %KMP_DUPLICATE_LIB_OK%

结果显示为TRUE，则重启Jupyter notebook，问题解决。
————————————————

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/weixin_42424046/article/details/136614711

=================================================================
Layer (type:depth-idx)                   Param #
=================================================================
Model                                    --
├─Conv2d: 1-1                            320
├─MaxPool2d: 1-2                         --
├─Conv2d: 1-3                            18,496
├─MaxPool2d: 1-4                         --
├─Linear: 1-5                            102,464
├─Linear: 1-6                            650
=================================================================
Total params: 121,930
Trainable params: 121,930
Non-trainable params: 0
=================================================================