Dataloader的使用

    

 DataLoader有很多参数,但常用的有下面五个:

  • dataset表示Dataset类,传入读取的dataset即可;
  • batch_size表示一次读取多少数据
  • num_works表示是否多进程读取数据
  • shuffle表示每个epoch是否乱序
  • drop_last表示当样本数不能被batch_size整除时,是否舍弃最后一批数据

 示例:

        导入:

from torch.utils.data import DataLoader
dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
train = torchvision.datasets.CIFAR10(root='./dataset', train=True,
                                     transform=dataset_transform, download=False)
test = torchvision.datasets.CIFAR10(root='./dataset', train=False,
                                    transform=dataset_transform, download=False)
test_loader = DataLoader(dataset=test, batch_size=64, shuffle=True, 
                         num_workers=0, drop_last=False)

看看Dataloder的输出

for data in test_loader:
    imgs, targets = data
    print(imgs.shape)
    print(targets)

截取了前两次batch,可以看到他是一个64维的tensor 

输出到TensorBoard中看下

writer = SummaryWriter("logs")
step = 0
for epoch in range(2):
    for data in test_loader:
        imgs, targets = data
        writer.add_images("Epoch:{}".format(epoch), imgs, step)
        step = step + 1
writer.close()

 这里设置shuffle为False可以看到两次epoch都一样

 

 左图drop_last=False,右图drop_last=True

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值