百度飞桨PaddelePaddle-21天零基础实践深度学习-【手写数字识别】1

最新推荐文章于 2023-08-15 08:00:00 发布

神经兮兮咕咕鸡

最新推荐文章于 2023-08-15 08:00:00 发布

阅读量501

点赞数

文章标签：深度学习 python 机器学习人工智能

本文链接：https://blog.csdn.net/weixin_44708890/article/details/108001504

版权

百度飞桨PaddelePaddle-21天零基础实践深度学习-【手写数字识别】1

- 数据处理
- 实践作业

今天毕然老师通过经典案例【手写数字识别任务】展开，模型方面从房价预测模型过渡到手写体识别模型。使用“横纵式”教学法中的纵向极简方案快速完成手写数字识别任务的建模，但模型测试效果并未达成预期。所以考虑从横向展开，如图所示，逐个环节优化，以达到最优训练效果。
图1：“横纵式”教学法 — 数据处理优化

数据处理

步骤：读入数据——划分数据集——生成批次数据——训练样本集乱序——校验数据有效性

代码如下：

# 加载飞桨和相关数据处理的库
import os
import random
import paddle
import paddle.fluid as fluid
from paddle.fluid.dygraph.nn import Conv2D, Pool2D, Linear
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image

import gzip
import json

#封装函数
# 定义数据集读取器
def load_data(mode='train'):

    # 数据文件
    datafile = './work/mnist.json.gz'
    print('loading mnist dataset from {} ......'.format(datafile))
    data = json.load(gzip.open(datafile))
    train_set, val_set, eval_set = data

    # 数据集相关参数，图片高度IMG_ROWS, 图片宽度IMG_COLS
    IMG_ROWS = 28
    IMG_COLS = 28

    if mode == 'train':
        imgs = train_set[0]
        labels = train_set[1]
    elif mode == 'valid':
        imgs = val_set[0]
        labels = val_set[1]
    elif mode == 'eval':
        imgs = eval_set[0]
        labels = eval_set[1]

    imgs_length = len(imgs)

    assert len(imgs) == len(labels), \
          "length of train_imgs({}) should be the same as train_labels({})".format(
                  len(imgs), len(labels))

    index_list = list(range(imgs_length)