深度学习day5（DataLoader的使用）

2401_83649141

已于 2024-08-16 11:35:34 修改

阅读量213

点赞数 3

文章标签：深度学习人工智能

于 2024-08-16 11:25:46 首次发布

本文链接：https://blog.csdn.net/2401_83649141/article/details/141254648

版权

DataLoader 官方文件查看方法：pytorch官网 -> document -> pytorch -> 搜索 dataloader (搜不到直接左边找torch.utils.data)

import torchvision

# 准备的测试数据集
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./dataset_2",train=False,transform=torchvision.transforms.ToTensor())

test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=False,num_workers=0,drop_last=True)
# 会返回一个img元组，和一个target元组

# 测试数据集中的第一张图片及target
img,target = test_data[0]
print(img.shape)
print(target)

writer = SummaryWriter("dataloader")
for epoch in range(2):
    step = 0
    for data in test_loader:
        imgs,targets = data
        # print(imgs.shape)
        # print(targets)
        writer.add_images("Epoch: {}".format(epoch),imgs,step)
        step = step + 1

writer.close()

Dataloader 代码的解释：

test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=False,num_workers=0,drop_last=True)

batch_size=64  # 每次抓取64张图片
shuffle=False  # False 每次按顺序抓取； True 每次随即抓取
num_workers=0  # 指定数据加载时使用的进程数（workers的数量）
drop_last=True # 在最后的一组图片数量不够时，False 表示不舍去这一组; True 表示舍去

Dataloader 代码的返回值：

for images, labels in test_loader:  
    print(images.shape)  # 输出: torch.Size([64, 3, 32, 32])  
    print(labels.shape)  # 输出: torch.Size([64])  
    # 注意：这里只是展示了如何访问数据和标签的形状，并没有进行任何实际的数据处理或模型评估。  
    break  # 只打印第一个批次的数据，防止无限循环

当你迭代test_loader时，每次迭代返回的值是一个元组（tuple），其中包含两个元素：

images：一个形状为[batch_size, channels, height, width]的张量（Tensor），其中batch_size是每批的样本数（这里是64），channels是通道数（对于CIFAR-10，它是3，代表RGB），height和width是图像的高度和宽度（对于CIFAR-10，都是32）。
labels：一个形状为[batch_size]的张量，包含每个样本的类别标签。这些标签是整数，范围从0到9，代表CIFAR-10数据集中的10个类别。