1.术语
Data size:数据大小
但是内存有限不能把数据一下子全给 module,所以就要分批次的输入数据
Batch:一批数据
Iteration:这一Batch 数据,输入模型训练一遍就叫 Iteration
Epoch:将所有的 Iteration 都完成后,就叫一次Epoch
2.Dataset
是对数据的抽象,可以通过 Dataset 知道data 是一个多大的数据集,也可以通过他知道数据中某一行数据是什么。
3.DataLoader
会在dataset之上会做进一步处理,将数据重新乱序,从中间拿出一个Batch出来。等等