PaddlePaddle学习笔记——手写数字识别模型的构建

最新推荐文章于 2024-05-18 15:05:09 发布

小辰辰爱学习

最新推荐文章于 2024-05-18 15:05:09 发布

阅读量1.4k

点赞数

分类专栏： Paddle学习文章标签：神经网络计算机视觉

本文链接：https://blog.csdn.net/baidu_40383992/article/details/108050276

版权

PaddlePaddle学习笔记——手写数字识别模型的构建

简介

简介

使用极简方案快速完成手写数字识别建模。

手写数字识别

数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力，目前比较受关注的是手写数字识别。手写数字识别是一个典型的图像分类问题，已经被广泛应用于汇款单号识别、手写邮政编码识别等领域，大大缩短了业务处理时间，提升了工作效率和质量。
在处理如图1 所示的手写邮政编码的简单图像分类任务时，可以使用基于MNIST数据集的手写数字识别模型。MNIST是深度学习领域标准、易用的成熟数据集，包含60000条训练样本和10000条测试样本。

任务输入：一系列手写数字图片，其中每张图片都是28x28的像素矩阵。
任务输出：经过了大小归一化和居中处理，输出对应的0~9的数字标签。

构建手写数字识别的神经网络模型流程

在这里插入图片描述
可以划分为数据处理、定义网络结构和训练过程三个部分。

前提条件

在数据处理前，首先要加载飞桨与手写数字识别模型相关的类库，实现方法如下：

#加载飞桨和相关类库
import paddle
import paddle.fluid as fluid
from paddle.fluid.dygraph.nn import Linear
import numpy as np
import os
from PIL import Image

数据处理

飞桨提供了多个封装好的数据集API，涵盖计算机视觉、自然语言处理、推荐系统等多个领域，帮助读者快速完成深度学习任务。如在手写数字识别任务中，通过paddle.dataset.mnist可以直接获取处理好的MNIST训练集、测试集，飞桨API支持如下常见的学术数据集：
链接: 学术数据集.
mnist
cifar
Conll05
imdb
imikolov
movielens
sentiment
uci_housing
wmt14
wmt16
通过paddle.dataset.mnist.train()函数设置数据读取器，batch_size设置为8，即一个批次有8张图片和8个标签，代码如下所示。

# 如果～/.cache/paddle/dataset/mnist/目录下没有MNIST数据，API会自动将MINST数据下载到该文件夹下
# 设置数据读取器，读取MNIST数据训练集
trainset = paddle.dataset.mnist.train()
# 包装数据读取器，每次读取的数据数量设置为batch_size=8
train_reader = paddle.batch(trainset, batch_size=8)

会得到如下结果：

Cache file /home/aistudio/.cache/paddle/dataset/mnist/train-images-idx3-ubyte.gz not found, downloading https://dataset.bj.bcebos.com/mnist/train-images-idx3-ubyte.gz 
Begin to download

Download finished
Cache file /home/aistudio/.cache/paddle/dataset/mnist/train-labels-idx1-ubyte.gz not found, downloading https://dataset.bj.bcebos.com/mnist/train-labels-idx1-ubyte.gz 
Begin to download
........
Download finished

paddle.batch函数将MNIST数据集拆分成多个批次，通过如下代码读取第一个批次的数据内容，观察打印结果。

# 以迭代的形式读取数据
for batch_id, data in enumerate(train_reader()):
    # 获得图像数据，并转为float32类型的数组
    img_data = np.array([x[0] for x in data]).astype('float32')
    # 获得图像标签数据，并转为float32类型的数组
    label_data = np.array([x[1] for x in data]).astype</

最低0.47元/天解锁文章

小辰辰爱学习

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
PaddlePaddle学习笔记——手写数字识别模型的构建

PaddlePaddle学习笔记——手写数字识别模型的构建简介手写数字识别构建手写数字识别的神经网络模型流程前提条件数据处理数据结果模型设计训练配置训练过程模型测试参考文献简介使用极简方案快速完成手写数字识别建模。手写数字识别数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力，目前比较受关注的是手写数字识别。手写数字识别是一个典型的图像分类问题，已经被广泛应用于汇款单号识别、手写邮政编码识别等领域，大大缩短了业务处理时间，提升了工作效率和质量。在处理如图1 所示的手写邮政
复制链接

扫一扫

专栏目录