《昇思25天学习打卡营第3天 | 昇思MindSpore数据集 Dataset》

第三天
今天学习了不同的数据集加载方式、数据集常见操作和自定义数据集方法。
1.数据集加载。
以Mnist数据集为例。mindspore.dataset提供的接口仅支持解压后的数据文件,因此我们使用download库下载数据集并解压。
2.数据集迭代。
用create_tuple_iterator或create_dict_iterator接口创建数据迭代器,迭代访问数据,访问的数据类型默认为Tensor;若设置output_numpy=True,访问的数据类型为Numpy。
3.数据集常见操作:
3.1数据集随机shuffle可以消除数据排列造成的分布不均问题。
3.2map操作是数据预处理的关键操作,可以针对数据集指定列(column)添加数据变换(Transforms),将数据变换应用于该列数据的每个元素,并返回包含变换后元素的新数据集。
3.3将数据集打包为固定大小的batch是在有限硬件资源下使用梯度下降进行模型优化的折中方法,可以保证梯度下降的随机性和优化计算量。
4.自定义数据集
4.1可随机访问数据集
4.2可迭代数据集
4.2.1生成器

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值