记录pytorch的API学习之Dataset与Dataloader（供自己回顾复习）

最新推荐文章于 2022-08-25 17:56:21 发布

柠檬也可以不酸

最新推荐文章于 2022-08-25 17:56:21 发布

阅读量1.6k

点赞数

分类专栏： python学习记录文章标签： pytorch

本文链接：https://blog.csdn.net/chengxy1998/article/details/123600308

版权

本文介绍了PyTorch中torch.utils.data.Dataset和Dataloader的使用。Dataset负责从磁盘加载数据并预处理，需实现__init__,__len__和__getitem__方法。Dataloader则将样本打包成minibatch，支持shuffle和多进程加载，通过参数如batch_size, num_workers和collate_fn定制数据处理流程。Dataloader的sampler和shuffle不能同时启用。" 79163472,7446096,Picks的区间最值段树优化,"['数据结构', '算法', '线段树', '区间操作']

摘要由CSDN通过智能技术生成

pytorch官方对应的教程
torch.utils.data.Dataset主要是针对单个样本
torch.utils.data.Dataloader针对多个样本.

简单的说是通过torch.utils.data.Dataset得到单个样本过后，再用torch.utils.data.Dataloader把它变成随机梯度下降算法训练所需要的minibatch的形式（比如把多个样本打包成一个batch、或者把样本顺序打乱等等操作都可以通过Dataloader来实现，通常我们会将多个样本同时进行训练，这样一方面可以加快训练速度，另一方面可以提高抗噪性。

torch.utils.data.Dataset

Dataset主要是从磁盘中加载数据，并对样本和标签做一些预处理。

在这里插入图片描述
自定义 Dataset 类必须实现三个函数__init__,__len __ ,__getitem __。（继承torch.utils.data.Dataset这个类）
def getitem(self, index):
raise NotImplementedError
该函数通过索引来返回训练样本，比如训练样本有100个，那index的范围为[0,99].

torch.utils.data.D

最低0.47元/天解锁文章

柠檬也可以不酸

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
记录pytorch的API学习之Dataset与Dataloader（供自己回顾复习）

pytorch官方对应的教程torch.utils.data.Dataset主要是针对单个样本torch.utils.data.Dataloader针对多个样本.简单的说是通过torch.utils.data.Dataset得到单个样本过后，再用torch.utils.data.Dataloader把它变成随机梯度下降算法训练所需要的minibatch的形式（比如把多个样本打包成一个batch、或者把样本顺序打乱等等操作都可以通过Dataloader来实现，通常我们会将多个样本同时进行训练，这样一方
复制链接

扫一扫