《昇思25天学习打卡营第3天|数据集Dataset》

最新推荐文章于 2024-06-26 21:24:02 发布

源远流长冬夏青青

最新推荐文章于 2024-06-26 21:24:02 发布

阅读量878

点赞数 19

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QAQ23333333333/article/details/139982200

版权

文章目录

前言
自定义数据集
与pytorch简单对比
个人打卡

前言

昇思25天学习打卡营第3天的打卡文章，主要目标是了解mindspore是如何加载自定义数据集的，还有数据集的常用操作，与pytorch自定义数据集进行简单对比差异。关于mindspore.dataset提供的内置数据集可以通过官方文档数据集Dataset来了解学习。

自定义数据集

mindspore.dataset模块提供了一些常用的公开数据集和标准格式数据集的加载API。

对于MindSpore暂不支持直接加载的数据集，可以构造自定义数据加载类或自定义数据集生成函数的方式来生成数据集，然后通过GeneratorDataset接口实现自定义方式的数据集加载。

GeneratorDataset支持通过可随机访问数据集对象、可迭代数据集对象和生成器(generator)构造自定义数据集，下面分别对其进行介绍。

可随机访问数据集

可随机访问数据集是实现了__getitem__和__len__方法的数据集，表示可以通过索引/键直接访问对应位置的数据样本。

例如，当使用dataset[idx]访问这样的数据集时，可以读取dataset内容中第idx个样本或标签。
在这里插入图片描述

可迭代数据集

可迭代的数据集是实现了__iter__和__next__方法的数据集，表示可以通过迭代的方式逐步获取数据样本。这种类型的数据集特别适用于随机访问成本太高或者不可行的情况。

例如，当使用iter(dataset)的形式访问数据集时，可以读取从数据库、远程服务器返回的数据流。

下面构造一个简单迭代器，并将其加载至GeneratorDataset。
在这里插入图片描述

生成器

生成器也属于可迭代的数据集类型，其直接依赖Python的生成器类型generator返回数据，直至生成器抛出StopIteration异常。

下面构造一个生成器，并将其加载至GeneratorDataset。
在这里插入图片描述

与pytorch简单对比

PyTorch:
DataLoader需要接收一个数据加载类、采样器，及批处理、混洗、多进程并行度等参数，以实现一个具有采样、分批、混洗等功能的数据迭代对象。其中dataset参数支持继承自torch.utils.data.Dataset的自定义类，或传入由torchvision.datasets、torchtext.datasets、torchaudio.datasets等组件中预定义好的数据集加载类。

MindSpore：
GeneratorDataset需要接收一个数据加载类、采样器、混洗、分片和多进程并行性来创建一个用于数据迭代的迭代器。此API与PyTorch的DataLoader功能定位一样，均是用于加载自定义的数据集，但参数列表差异较大。

定义一个迭代类型的数据集类与一个随机访问类型的数据集类，并通过DataLoader/GeneratorDataset加载。注意DataLoader的shuffle参数默认行为是False，GeneratorDataset的shuffle默认行为是True。
num_samples (int, 可选) - 指定从数据集中读取的样本数。默认值： None ，读取全部样本。

个人打卡

在这里插入图片描述

源远流长冬夏青青

关注

19
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
《昇思25天学习打卡营第3天|数据集Dataset》

昇思25天学习打卡营第3天的打卡文章，主要目标是了解mindspore是如何加载自定义数据集的，还有数据集的常用操作，与pytorch自定义数据集进行简单对比差异。关于mindspore.dataset提供的内置数据集可以通过官方文档数据集Dataset来了解学习。模块提供了一些常用的公开数据集和标准格式数据集的加载API。对于MindSpore暂不支持直接加载的数据集，可以构造自定义数据加载类或自定义数据集生成函数的方式来生成数据集，然后通过接口实现自定义方式的数据集加载。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。