epoch: 所有样本都输入到模型中
iteration: 一批样本输入到模型中
batchsize: 批大小,决定一个epoch有多少个iteration (一次输入多少个样本到模型中 )
数据:
1)数据收集:img, label
2)数据划分:train、valid和test
3)数据读取:dataloader :
sampler :index(生成索引)
dataset :img,label(根据索引读取图片和标签)
4)数据预处理:transforms
dataloder
每次for循环,每次iteration就是从dataloder中获取一个batch size大小的数据
dataset
getitem:接受索引,返回样本(图片和标签)
数据读取
1)读哪些数据:sampler输出的index(每个iteration读取一批数据)
2)从哪儿读数据:dataset的data_dir(在硬盘中如何找数据)
3)怎么读数据:dataset中的getitem
数据(代码思路)
首先写数据路径(硬盘中),再写数据预处理transform,然后Dataset,最后DataLoader(整理成batch_size的形式)