PyTorch④---DataLoader的使用

莫听穿林打叶声@

已于 2022-10-01 11:03:39 修改

阅读量217

点赞数

分类专栏：笔记 PyTorch_learn 文章标签： pytorch 深度学习 python

于 2022-07-27 15:00:39 首次发布

本文链接：https://blog.csdn.net/weixin_45703331/article/details/126014932

版权

PyTorch_learn 同时被 2 个专栏收录

19 篇文章 2 订阅

订阅专栏

笔记

17 篇文章 0 订阅

订阅专栏

本文介绍了DataLoader在神经网络训练中的作用，它用于将数据集分批处理，例如设置batch_size为64时，每次处理64张图片。在双层循环中，外层循环遍历所有图片，内层循环按批次打包数据。通过示例展示了如何使用DataLoader加载CIFAR10数据集，并利用SummaryWriter记录测试数据的图像。同时讨论了shuffle参数对数据加载的影响。

摘要由CSDN通过智能技术生成

DataLoader的使用

官方文档：
在这里插入图片描述

batch_size=64的时候，表明每次在数据集中取64个进行打包，数据集中共有10000张图片，所以取1000/64次。
如果是双层循环的情况下，外层循环走一次，10000张图片全部跑一次。内层循环走1000/64次，一次跑64张图片。

送入神经网络时，一般用DataLoader进行打包。

import torchvision
#准备的测试数据集
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data=torchvision.datasets.CIFAR10("./dataset_CIFAR10",train=False,transform=torchvision.transforms.ToTensor())
test_loader=DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

#测试集中第一张图片及其target
img,target=test_data[0]
print('测试集图片的第一张形状:{}'.format(img.shape))
print('测试集图片的第一张分类:{}'.format(target))


'''
dataset  return img,target
'''
'''
batch_size=4: 4个4个进行打包
             从dataset中取四个数据,img0,target0=dataset[0] img1,target1=dataset[1] img2,target2=dataset[2] img3,target3=dataset[3]
             把img0,img1,img2,img3进行打包,返回imgs
             把target0,1,2,3进行打包,返回targets
             用for遍历获取

drop_last=False:不够4个会留下，True不够4个会舍去
'''

writer=SummaryWriter("../logs_dataloader")
step=0
print("因为是64个图片打包，64个target打包。注意输出的tensor形状")
for data in test_loader:
    imgs,targets=data
    print('打包后的图片形状:{}'.format(imgs.shape))
    print('打包后的图片类型:{}'.format(type(imgs)))
    print('打包后的target:{}'.format(targets))
    writer.add_images("test_data",imgs,step)
    step=step+1

'''
shuffle=True:循环两轮的图片不一样
shuffle=False:循环两轮的图片一样
'''
for epoch in range(2):
    step = 0
    for data in test_loader:
        imgs, targets = data
        # print(imgs.shape)
        # print(targets)
        writer.add_images("epoch:{}".format(epoch), imgs, step)
        step = step + 1
writer.close()