PyTorch学习笔记（五）——DataLoader

忧郁小薯条_

已于 2023-05-13 11:47:51 修改

阅读量83

点赞数

文章标签： pytorch

于 2023-04-29 23:08:46 首次发布

本文链接：https://blog.csdn.net/weixin_45827876/article/details/130443346

版权

pytorch入门专栏收录该内容

17 篇文章 2 订阅

订阅专栏

1 参数

大部分有默认值，实际中只需要设置少量的参数即可

以扑克牌举例

batch_size：每次抓牌抓几张
shuffle：是否打乱，值为True的话两次打牌时牌的顺序是不一样。默认为False，一般用True
num_workers：加载数据时采用单个进程还是多个进程，多进程的话速度相对较快，默认为0（主进程加载）。Windows系统下该值>0会有问题（报错提示：BrokenPipeError）
drop_last：100张牌每次取3张，最后会余下1张，剩下的这张牌是否舍去。值为True代表舍去这张牌、不取出，False代表要取出该张牌

2 使用

import torchvision
from torch.utils.data import DataLoader

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
test_data = torchvision.datasets.CIFAR10(root="./datasets",train=False,transform=dataset_transform,download=True)
test_loader = DataLoader(dataset=test_data,batch_size=4,shuffle=True,num_workers=0,drop_last=False)

# 测试数据集中第一张图片及target
img,target = test_data[0]
print(img.shape)
print(target)

for data in test_loader:
    imgs,targets = data
    print(imgs.shape)
    print(targets)

Tensorboard展示

1、batch_size为64，drop_last为False

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

test_data = torchvision.datasets.CIFAR10(root="./datasets",train=False,transform=dataset_transform,download=True)
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

writer = SummaryWriter("log2")
step = 0
for data in test_loader:
    imgs,targets = data
    writer.add_images("test_data",imgs,step)
    step += 1
writer.close()

由于 drop_last 设置为 False，所以最后16张图片（没有凑齐64张）

2、shuffle为True

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

test_data = torchvision.datasets.CIFAR10(root="./datasets",train=False,transform=dataset_transform,download=True)
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

writer = SummaryWriter("log2")
for epoch in range(2):
    step = 0
    for data in test_loader:
        imgs,targets = data
        writer.add_images("Epoch:{}".format(epoch),imgs,step)
        step += 1
writer.close()