作为一个菜鸟进行minds pore研究的时候,很多地方都不明白,所以我建议用jupyterlab来进行操作,以避免产生错误,一步步的写下这些文章,来见证自己的成长。
准备数据集阶段
MindSpore提供了部分常用数据集和标准格式数据集的加载接口,我们可以直接使用mindspore.dataset中对应的数据集加载类进行数据加载。
其代码如下:
!mkdir ./datasets #####文件夹的创建
!wget -N https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/datasets/cifar-10-binary.tar.gz --no-check-certificate
!wget -N https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/datasets/MNIST_Data.zip --no-check-certificate #####数据集的下载
!unzip -d ./datasets -o MNIST_Data.zip
!tar -zxvf cifar-10-binary.tar.gz -C ./datasets########进行数据集的解压
截图如下:
数据集的加载 ,迭代以及自定义
我们可以通过mindspore所自带的Cifar10Dataset接口加载CIFAR-10数据集,并且使用顺序采样器来获得,前五个样本的信息。
数据集加载代码如下:
import mindspore.dataset as ds
DATA_DIR = “./datasets/cifar-10-batches-bin”#######定义地址
sampler = ds.Sequen