torch.utils.data.DataLoader源码地址:https://github.com/pytorch/pytorch/blob/master/torch/utils/data/dataloader.py
Dataloader接口主要将上篇博客中自定义的数据读取接口的输出按照batch size封装成Tensor,后续再包装成Variable作为模型的输入。该接口就像是“快递公司(dataloader)”,把一个个“物品(数据)”“打包(封装)成快递(Tensor)”,然后进入“高速公路(搭建好的网络)”传输。
Dataloader的官方定义:
class DataLoader(object):
def __init__(self, dataset, batch_size=1, shuffle=False, sampler=None,
batch_sampler=None, num_workers=0, collate_fn=None,
pin_memory=False, drop_last=False, timeout=0):
- dataset:上一篇介绍的按自定义形式(一般为(image, label)形式)准备好的数据集,也就是“快递物品”;