Dataloader的使用

搁浅丶.

已于 2023-04-01 21:37:29 修改

阅读量292

点赞数

分类专栏：深度学习——Pytorch 文章标签： python 开发语言

于 2023-04-01 19:36:08 首次发布

本文链接：https://blog.csdn.net/weixin_64924692/article/details/129901502

版权

深度学习——Pytorch 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

DataLoader有很多参数，但常用的有下面五个：

dataset表示Dataset类，传入读取的dataset即可；
batch_size表示一次读取多少数据
num_works表示是否多进程读取数据
shuffle表示每个epoch是否乱序
drop_last表示当样本数不能被batch_size整除时，是否舍弃最后一批数据

示例：

导入：

from torch.utils.data import DataLoader

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
train = torchvision.datasets.CIFAR10(root='./dataset', train=True,
                                     transform=dataset_transform, download=False)
test = torchvision.datasets.CIFAR10(root='./dataset', train=False,
                                    transform=dataset_transform, download=False)
test_loader = DataLoader(dataset=test, batch_size=64, shuffle=True, 
                         num_workers=0, drop_last=False)

看看Dataloder的输出

for data in test_loader:
    imgs, targets = data
    print(imgs.shape)
    print(targets)

截取了前两次batch，可以看到他是一个64维的tensor

输出到TensorBoard中看下

writer = SummaryWriter("logs")
step = 0
for epoch in range(2):
    for data in test_loader:
        imgs, targets = data
        writer.add_images("Epoch:{}".format(epoch), imgs, step)
        step = step + 1
writer.close()

这里设置shuffle为False可以看到两次epoch都一样

左图drop_last=False，右图drop_last=True

搁浅丶.

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Dataloader的使用

左图drop_last=False，右图drop_last=True。这里设置shuffle为False可以看到两次epoch都一样。截取了前两次batch，可以看到他是一个64维的tensor。输出到TensorBoard中看下。看看Dataloder的输出。
复制链接

扫一扫

专栏目录