PyTorch深度学习入门笔记（七）DataLoader的使用

最新推荐文章于 2024-06-09 15:42:37 发布

雪天鱼

最新推荐文章于 2024-06-09 15:42:37 发布

阅读量6.2k

点赞数 6

分类专栏：深度学习文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/qq_44447544/article/details/122523261

版权

深度学习专栏收录该内容

28 篇文章 32 订阅

订阅专栏

课程学习笔记，课程链接
学习笔记同步发布在我的个人网站上，欢迎来访查看。

文章目录

一、dataloader简介
二、dataloader的使用

一、dataloader简介

dataset在程序中起到的作用是告诉程序数据在哪，每个索引所对应的数据是什么。相当于一系列的存储单元，每个单元都存储了数据。这里可以类比成一幅扑克牌，一张扑克牌就是一个数据，一幅扑克牌就是一个完整的数据集。

再把神经网络的输入获取类比成手，用手去抓扑克牌，每次抓几张，用一只手去抓取，还是用两只手，这就是 dataloader 要做的事，可以通过参数进行一个设置。
在这里插入图片描述

Pytoch 官网也对 dataloader 进行了一个介绍：
在这里插入图片描述
各个参数都有详细的描述，这里就不再赘述。

二、dataloader的使用

2.1 简单测试

测试代码：

import torchvision
from torch.utils.data import DataLoader

test_data = torchvision.datasets.CIFAR10("./dataset", False, torchvision.transforms.ToTensor())
test_loader = DataLoader(dataset=test_data, batch_size=4, shuffle=True, num_workers=0, drop_last=False)

img, target = test_data[0]
print(img.shape)
print(target)

# return of dataloader
for data in test_loader:
    imgs, targets = data
    print(imgs.shape)
    print(targets)

输出：
在这里插入图片描述
可以看到，单个数据读取时，输出是

torch.Size([3, 32, 32])
3

即图片为RGB三通道，像素大小为32*32，tag为3
采用 dataloader(batch_size=4)读取时：

torch.Size([4, 3, 32, 32])
tensor([1, 7, 9, 2])
torch.Size([4, 3, 32, 32])
tensor([2, 7, 4, 7])

即4张图片，每个图片都为RGB三通道，像素大小为32*32
然后tag也打包在一起了，返回为 tensor([1, 7, 9, 2])形式。
注：Dataloader默认采用的是从数据集中进行随机抓取。

2.2 通过tensorboard显示抓取结果

示例代码：

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./dataset", False, transform=torchvision.transforms.ToTensor())
test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True, num_workers=0, drop_last=True)

img, target = test_data[0]
print(img.shape)
print(target)

# return of dataloader
writer = SummaryWriter("dataloader")
step = 0
for data in test_loader:
    imgs, targets = data
    # print(imgs.shape)
    # print(targets)
    writer.add_images("test_data_drop_last", imgs, step)
    step = step + 1
writer.close()

结果：
在这里插入图片描述
这里每次抓取64个数据，用 add_images 函数写入到 SummaryWriter实例化对象中，再进行显示：
这里当 DataLoader 的输入 drop_last设置为True时，最后一次抓取的数据若不满64，则会被丢弃。为Flase时则不会，如上图的上半部分所示，最后一次抓取了16个数据，不满64，没有丢弃。

2.3 shuffle

示例代码：

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./dataset", False, transform=torchvision.transforms.ToTensor())
test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=False, num_workers=0, drop_last=True)

img, target = test_data[0]
print(img.shape)
print(target)

# return of dataloader
writer = SummaryWriter("dataloader")
step = 0
for epoch in range(2):
    for data in test_loader:
        imgs, targets = data
        # print(imgs.shape)
        # print(targets)
        writer.add_images("Epoch:{}".format(epoch), imgs, step)
        step = step + 1
writer.close()

shuffle为 False时，两次抓取的顺序不会进行打乱，即两次抓取的结果一样
shuffle为 True时，两次抓取的顺序会进行打乱，即两次抓取的结果不一样

dataloader 返回的 imgs 可以作为神经网络的输入，那下一篇博客将介绍如何搭建神经网络。

雪天鱼

关注

6
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
PyTorch深度学习入门笔记（七）DataLoader的使用

课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。文章目录一、dataloader简介二、dataloader的使用2.1 简单测试2.2 通过tensorboard显示抓取结果2.3 shuffle一、dataloader简介dataset在程序中起到的作用是告诉程序数据在哪，每个索引所对应的数据是什么。相当于一系列的存储单元，每个单元都存储了数据。这里可以类比成一幅扑克牌，一张扑克牌就是一个数据，一幅扑克牌就是一个完整的数据集。再把神经网络的输入获取类比成手，用手去抓扑克牌
复制链接

扫一扫