数据
数据收集
Img,Label
数据划分
train:训练集,训练模型
valid:验证集,验证模型是否过拟合(可以理解为用验证集挑选模型)
test:测试集,测试挑选出来模型的性能
数据读取
DataLoader
sampler:生成索引
DataSet:Img,Label,根据索引读取图片和标签
torch.utils.data.DataLoader
功能:构建可迭代的数据装载器
- dataset:Dataset类,决定数据从哪读取以及如何读取
- batchsize:批大小
- num——works:是否多进程读取数据
- shuffle:每个epoch是否乱序
- drop_last:当样本数不能被batchsize整除时,是否舍弃最后一批数据
Epoch:所有训练样本都已输入到模型中,称为一个Epoch
Iteration:一批样本输入到模型中,称之为一个Iteration
Batchsize:批大