在数据集的划分上:
既可以将训练用例和测试用例用四个不同的文件保存,分别是训练数据名和训练标签名,测试数据名和测试标签名,再根据文件中的名称,依次从全部数据中读取,完成划分。
也可以将全部数据的名称保存在两个文件中,分别是全部数据名和全部标签名,按照一定的比例划分,依次读取训练集和测试集。这种方法用到的相关代码如下:
import torch
import torchvision
import torchvision
import torchvision.transforms as transforms
import torch.utils.data as Data
import numpy as np
from torch.utils.data import Dataset
train_dataset = torchvision.datasets.MNIST(root='./data', #文件存放路径
train=True, #提取训练集
transform=transforms.ToTensor(), #将图像转化为Tensor
download=True)
sample_size = len(train_dataset)#获取样本总数
indices = list