深度学习：pytorch 用官网自学dataloader(训练图片修改)

yu矞

已于 2024-02-17 15:37:10 修改

阅读量1.5k

点赞数 47

文章标签：深度学习 pytorch 学习机器学习 python

于 2024-02-17 15:33:33 首次发布

本文链接：https://blog.csdn.net/2301_80127898/article/details/136137933

版权

[At the heart of PyTorch data loading utility is the torch.utils.data.DataLoader class.]

准备：

1.pytorch官网链接PyTorch

2.训练采用数据集准备

这里推荐用：CIFAR10(数据集)

执行下面代码，就可以下载了：download 设置为True

import torchvision
train_data = torchvision.datasets.CIFAR10(root="./dataset",
transform=torchvision.transforms.ToTensor(),
train=True,
download =True)
test_data = torchvision.datasets.CIFAR10(root="./dataset",
transform=torchvision.transforms.ToTensor(),
train=False,
download =True)

可以得到训练集train_data和测试集test_data。

3.关于dataloader的预备知识

torch.utils.data — PyTorch 2.2 documentation

这是整个类，但今天我们重点讲的是函数Dataloader

These options are configured by the constructor arguments of a DataLoader

就是说功能可以由DataLoader实现，又展示了这些参数。

截图自官网

启动

dataset

indicates a dataset object to load data from 即数据来源。

列举了一些（which has a default function）有默认值的。参考准备标题下的图片，可以发现真正要填的只有dataset即数据来源。根据文章开头下载的数据集，把test_data或train_data 填进去就行了。

batch_size

batch_size 这个参数控制的是一个步骤有多少图片，默认值是1，即每个步骤一张图片。

那我们再在tensorboard上面呈现一下。这里我就不填了，就是默认值1（代码直接放了，tensorboard之前讲过深度学习：pytorch 图片呈现 tensorboard (add_image)控制台自学调试检验，含终极代码-CSDN博客

import torchvision
from torch.utils.tensorboard import SummaryWriter
from torch.utils.data import DataLoader
trans_to = torchvision.transforms.ToTensor()
train_set = torchvision.datasets.CIFAR10(root="./dataset",transform= trans_to,train=True,download = False)
test_set = torchvision.datasets.CIFAR10(root = "./dataset",transform= trans_to,train =False ,download =False)
test_loader =DataLoader(dataset=test_set)
writer = SummaryWriter('fff')
step = 0
for data in test_loader:
    imgs,targets =data
    writer.add_images("batch_size=1",imgs,step)
    step = step +1

writer.close()

（刚刚下载过了，我这里download就设置成False了，但你“./dataset”这个路径刚刚写的是什么这里就写什么不然识别不出来的）

board上就呈现出这个了。那我们试试看batch_size=64

test_loader =DataLoader(dataset=test_set,batch_size=64)

然后把名称也改一下，改成batch_size=64 直观一点。

shuffle

默认有序，True的话要reshuffle（重新排序）

drop_last

默认是最后一步展现的图片会少一些。就是整个数据的个数可以不可以被你设置的batch_size整除，如果不可以，最后一步展示的必然与你设置的batch_size不同，而drop_last就是决定要不要展示剩余的图片，如果True则不展示，False则展示。

前面都是默认展示的，看看

这是刚刚的设置为64的，显然，我把其拖到最后一步，这一步里的数据一定没有64张，也确实没有。然后可以看到总共有156步。

那我改一下设置，设置其为True

test_loader =DataLoader(dataset=test_set,batch_size=64,shuffle=True,drop_last=True)

最后一页还是有64张，但只有155步了。说明剩余的被删掉了。

那个

其他的，有兴趣试试。

yu矞

关注

47
点赞
踩
28

收藏

觉得还不错? 一键收藏
1
评论
深度学习：pytorch 用官网自学dataloader(训练图片修改)

官网：At the heart of PyTorch data loading utility is thetorch.utils.data.DataLoaderclass.
复制链接

扫一扫