昇思25天学习打卡营第3天

最新推荐文章于 2024-07-19 15:16:23 发布

duhubin

最新推荐文章于 2024-07-19 15:16:23 发布

阅读量129

点赞数 5

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duhubin/article/details/139976692

版权

数据集 Dataset学习

1.数据集加载

因为mindspore.dataset只支持解压后的数据文件，所以需要下将下载的数据进行解压。

2.数据集的迭代

再进入神经网络训练前，一般采取迭代方式来获取数据。

3.数据集常用操作

（1）shuffle 数据集随机函数，消除数据排列造成的分布不均问题。

（2）map可以针对数据集指定列（column）添加数据变换（Transforms），将数据变换应用于该列数据的每个元素，并返回包含变换后元素的新数据集.

（3）batch 用于将数据集进行打包固定大小

4.自定义数据集

可以通过构造自定义数据加载类或函数来生成数据集

可随机访问数据集是实现了__getitem__和__len__方法的数据集，表示可以通过索引/键直接访问对应位置的数据样本。

可迭代的数据集是实现了__iter__和__next__方法的数据集，表示可以通过迭代的方式逐步获取数据样本。这种类型的数据集特别适用于随机访问成本太高或者不可行的情况。

生成器也属于可迭代的数据集类型，其直接依赖Python的生成器类型generator返回数据，直至生成器抛出StopIteration异常。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
昇思25天学习打卡营第3天

（2）map可以针对数据集指定列（column）添加数据变换（Transforms），将数据变换应用于该列数据的每个元素，并返回包含变换后元素的新数据集.方法的数据集，表示可以通过迭代的方式逐步获取数据样本。这种类型的数据集特别适用于随机访问成本太高或者不可行的情况。（1）shuffle 数据集随机函数，消除数据排列造成的分布不均问题。生成器也属于可迭代的数据集类型，其直接依赖Python的生成器类型。方法的数据集，表示可以通过索引/键直接访问对应位置的数据样本。可迭代的数据集是实现了。
复制链接

扫一扫

duhubin CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

36万+: 周排名

12万+: 总排名

7085: 访问

: 等级

97: 积分

12: 粉丝

15: 获赞

1: 评论

18: 收藏

私信

关注

热门文章

最新评论

对flv.js直播流延迟问题解决
恪愚: 大佬，我想问下第二段代码放在哪里，为啥我这边把它放在flvjs播放器事件侦听的addEventListener-playing里面报错buffered找不到
错误‘chromedriver‘ executable needs to be in PATH如何解
CSDN-Ada助手: 非常感谢你分享这篇博客，这是一个非常好的开始。你的解决方案对于遇到同样问题的人来说非常有用，希望你能继续分享更多有价值的内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
基于Python的常用数值排序算法比较分析
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。