昇思25天学习打卡营第3天|munger85

今天学习dataset

要训练肯定要有数据集,首先要下载数据集。

import numpy as np
from mindspore.dataset import vision
from mindspore.dataset import MnistDataset, GeneratorDataset
import matplotlib.pyplot as plt

下载的代码是
from download import download

url = “https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/”
“notebook/datasets/MNIST_Data.zip”
path = download(url, “./”, kind=“zip”, replace=True)

train_dataset = MnistDataset(“MNIST_Data/train”, shuffle=False)
print(type(train_dataset))

训练的时候,或者说在训练之前你要看一看数据长什么样,所以就需要用下面的方法去看一下数据到底是什么样子,维度是什么样子的?

def visualize(dataset):
figure = plt.figure(figsize=(4, 4))
cols, rows = 3, 3

plt.subplots_adjust(wspace=0.5, hspace=0.5)

for idx, (image, label) in enumerate(dataset.create_tuple_iterator()):
    figure.add_subplot(rows, cols, idx + 1)
    plt.title(int(label))
    plt.axis("off")
    print(image.shape)
    plt.imshow(image.asnumpy().squeeze(), cmap="gray")
    if idx == cols * rows - 1:
        break
plt.show()

visualize(train_dataset)

为了原数据的不均匀现象,所以需要把它进行洗牌。就像赌博的时候洗牌一样。
train_dataset = train_dataset.shuffle(buffer_size=64)
然后我们把数据进行一个缩放。并且还变成了小数。
train_dataset = train_dataset.map(vision.Rescale(1.0 / 255.0, 0), input_columns=‘image’)
把数据打包成1块1块的,这样子有利于效率这是训练的时候常用的做法。
train_dataset = train_dataset.batch(batch_size=32)

然后就是一些关于数据集的取数据的操作。这东西是基本的操作。
mindSpore的GeneratorDataset用loader的时候,这个loader得这样定义一个类
在这里插入图片描述
可迭代的loader又是下面这种写法

在这里插入图片描述
如果不想写class,可以用lamba函数

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值