菜菜学paddle第一篇：单层网络构建手写数字识别

若石之上

已于 2022-11-14 14:22:48 修改

阅读量951

点赞数

分类专栏：人工智能文章标签： paddle MNIST 数字识别手写神经网络

于 2022-11-14 14:21:15 首次发布

本文链接：https://blog.csdn.net/duzm200542901104/article/details/127844590

版权

人工智能专栏收录该内容

29 篇文章 1 订阅

订阅专栏

前言：

1、数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力，目前比较受关注的是手写数字识别。手写数字识别是一个典型的图像分类问题，已经被广泛应用于汇款单号识别、手写邮政编码识别等领域，大大缩短了业务处理时间，提升了工作效率和质量。

2、MNIST是深度学习领域标准、易用的、成熟的手写数字识别模型数据集，包含50 000条训练样本和10 000条测试样本。

一、数据加载

1、使用paddle自带的数据集，加载数据非常的方便，就一行代码：

    # 加载训练集 batch_size 设为 16
train_loader = paddle.io.DataLoader(paddle.vision.datasets.MNIST(mode='train'),
                                        batch_size=16,
                                        shuffle=True)

二、模型设计

1、新建文件MNIST.py

在该文件中定义模型和图像归一化处理函数

import paddle

class MNIST(paddle.nn.Layer):
    def __init__(self):
        super(MNIST, self).__init__()

        # 定义一层全连接层，输出维度是1
        self.fc = paddle.nn.Linear(in_features=784, out_features=1)

    # 定义网络结构的前向计算过程
    def forward(self, inputs):
        outputs = self.fc(inputs)
        return outputs

# 图像归一化函数，将数据范围为[0, 255]的图像归一化到[0, 1]
def norm_img(img):
    # 验证传入数据格式是否正确，img的shape为[batch_size, 28, 28]
    assert len(img.shape) == 3
    batch_size, img_h, img_w = img.shape[0], img.shape[1], img.shape[2]
    # 归一化图像数据
    img = img / 255
    # 将图像形式reshape为[batch_size, 784]
    img = paddle.reshape(img, [batch_size, img_h*img_w])

    return img

三、模型训练

1、新建文件HandWriteNum.py

2、训练之后直接保存模型参数

#加载飞桨和相关类库
import paddle
import paddle.nn.functional as F
import numpy as np
from MNIST import MNIST
from MNIST import norm_img
# 设置数据读取器，API自动读取MNIST数据训练集
train_dataset = paddle.vision.datasets.MNIST(mode='train')

train_data0 = np.array(train_dataset[0][0])
train_label_0 = np.array(train_dataset[0][1])

paddle.vision.set_image_backend('cv2')
# 声明网络结构
model = MNIST()
# 启动训练模式
model.train()


    # 加载训练集 batch_size 设为 16
train_loader = paddle.io.DataLoader(paddle.vision.datasets.MNIST(mode='train'),
                                        batch_size=16,
                                        shuffle=True)
# 定义优化器，使用随机梯度下降SGD优化器，学习率设置为0.001
opt = paddle.optimizer.SGD(learning_rate=0.001, parameters=model.parameters())


EPOCH_NUM = 100
for epoch in range(EPOCH_NUM):
    for batch_id, data in enumerate(train_loader()):
        images = norm_img(data[0]).astype('float32')
        labels = data[1].astype('float32')

        #前向计算的过程
        predicts = model(images)

        # 计算损失
        loss = F.square_error_cost(predicts, labels)
        avg_loss = paddle.mean(loss)

        #每训练了1000批次的数据，打印下当前Loss的情况
        if batch_id % 1000 == 0:
            print("epoch_id: {}, batch_id: {}, loss is: {}".format(epoch, batch_id, avg_loss.numpy()))

        #后向传播，更新参数的过程
        avg_loss.backward()
        opt.step()
        opt.clear_grad()

paddle.save(model.state_dict(), './mnist.pdparams')

四、模型验证

1、新建文件HandWriteNumEvalTest.py

2、加载模型测试数据

3、加载模型训练参数

4、输出验证结果

from MNIST import MNIST
import numpy as np
import paddle

# 定义预测过程
model = MNIST()
params_file_path = 'mnist.pdparams'
# 加载模型参数
param_dict = paddle.load(params_file_path)
model.load_dict(param_dict)
model.eval()

# 加载测试集 batch_size 设为 1
test_loader = paddle.io.DataLoader(paddle.vision.datasets.MNIST(mode='test'))
print(len(test_loader.dataset))
success = 0
error = 0
for data in test_loader.dataset:
    #image = norm_img(data[0]).astype('float32')
    image = data[0]
    """
    plt.imshow(image, cmap=plt.cm.binary)
    plt.axis('on') # 关掉坐标轴为 off
    plt.title('image') # 图像题目
    plt.show()
    """
    image = np.array(image).reshape(1, -1).astype(np.float32)
    # 图像归一化，保持和数据集的数据范围一致
    image = 1 - image / 255
    label = data[1].astype('int32')[0]
    result = model(paddle.to_tensor(image))
    result = result.numpy().astype('int32')[0][0];
    if (label == result) :
        success = success + 1
    else:
        error = error + 1

#  预测输出取整，即为预测的数字，打印结果
print("本次预测的正确的数量是{}， 错误的数量是{}".format(success, error))

从测试数据的结果来看，本次成功的数据是0，一万条数据，没有一个是预测成功的。

总结：

1、模型选择的不对，一切努力都白费，没法使用单层线性网络来预测数字识别。

若石之上

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
菜菜学paddle第一篇：单层网络构建手写数字识别

1、数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力，目前比较受关注的是手写数字识别。手写数字识别是一个典型的图像分类问题，已经被广泛应用于汇款单号识别、手写邮政编码识别等领域，大大缩短了业务处理时间，提升了工作效率和质量。2、MNIST是深度学习领域标准、易用的、成熟的手写数字识别模型数据集，包含50 000条训练样本和10 000条测试样本。从测试数据的结果来看，其实本次成功的数据是0，一万条数据，没有一个是预测成功的。
复制链接

扫一扫