深度学习(三)——MINIST手写图片识别

最新推荐文章于 2024-03-16 06:53:27 发布

Da小伙儿

最新推荐文章于 2024-03-16 06:53:27 发布

阅读量462

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_43633568/article/details/104519840

版权

本文介绍了使用深度学习模型进行MINIST手写数字识别的思路。网络结构包括三个层次，分别是28*28输入层到256节点的隐藏层，然后是256到64节点的隐藏层，最后输出层为10节点对应10个分类。在训练过程中，每次处理512个样本，并确保在计算梯度时每次都从零开始，以保证梯度更新的准确性。

摘要由CSDN通过智能技术生成

思路：
网络是三层：

h1=relu(w1*x+b1)-输入28*28，输出256
h2=relu(w2*h1+b2)-输入256，输出64
h3=w3*h2+b3-输入64，输出10
其中256，64是自己构想的，10是固定的结果10分类
每次是512个28*28的1通道图片进入一起处理，处理三次得出结果
注意
每次计算梯度都要先清零：optimizer.zero_grad()，不然梯度累加就不正确

import  torch
from    torch import nn
from    torch.nn import functional as F
from    torch import optim

import  torchvision
from    matplotlib import pyplot as plt

from    utils import plot_image, plot_curve, one_hot

batch_size = 512

# step1. load dataset
train_loader = torch.utils.data.DataLoader(
    torchvision.datasets.MNIST('mnist_data', train=True, download=False,
                               transform=torchvision.transforms.Compose([
                                   torchvision.transforms.ToTensor(),