不同自定义的dataset，生成的dataloader用tqdm和enumerate如何读取

最新推荐文章于 2024-11-24 17:46:35 发布

Zaгathustra

最新推荐文章于 2024-11-24 17:46:35 发布

阅读量3.4k

点赞数 4

分类专栏： pytorch 文章标签： pytorch 深度学习机器学习

本文链接：https://blog.csdn.net/Stephanie2014/article/details/121809486

版权

pytorch 专栏收录该内容

20 篇文章

订阅专栏

之前遇到的问题是，我自己定义了dataset的类，类似于下面的代码

class DealDataset(Dataset):
    """
        下载数据、初始化数据，都可以在这里完成
    """
    def __init__(self):
        xy = np.loadtxt('../dataSet/diabetes.csv.gz', delimiter=',', dtype=np.float32) # 使用numpy读取数据
        self.x_data = torch.from_numpy(xy[:, 0:-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])
        self.len = xy.shape[0]
    
    def __getitem__(self, index):
        x_data=self.x_data[index]
        y_data=self.y_data[index]
        return {'x_data':x_data,'y_data':y_data}

    def __len__(self):
        return self.len

这样就在读取上非常迷惑，不知道用enumerate和tqdm要怎么读数据，搞清楚后在这里简要记录一下对应关系

1.return {'x_data':x_data,'y_data':y_data}，

目前只会用enemerate读取

for i, data in enumerate(train_loader):
        x_data, y_data= data['x_data'], data['y_data']

2.把return改变，改为return self.x_data[index],self.y_data[index]

这样tqdm读取

for x_data,y_data in tqdm(train_loader):

enumerate读取

for idx,data in enumerate(train_loader):
    x_label=data[0]
    y_label=data[1]

另外，除了放在batch那里，tqdm也可以放在epoch的循环那里

for epoch in tqdm(range(100)):

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Zaгathustra

关注关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深度学习项目四：创建自定义数据集的dataset, DataLoader

m0_60890175的博客

07-16

1000

深度学习项目四：创建自定义数据集的dataset, DatasetLoader

PyTorch学习笔记（三）——Dataset和DataLoader

⚡

05-05

3904

目录一、一级目录1.1 二级目录1.1.1 三级目录一、一级目录 1.1 二级目录 1.1.1 三级目录

参与评论您还未登录，请先登录后发表或查看评论

Pytorch中dataloader之enumerate与iter，tqdm

开飞机的小毛驴儿

12-31

2万+

dataloader本质上是一个可迭代对象，使用iter()访问，不能使用next()访问；使用iter(dataloader)返回的是一个迭代器，然后可以使用next访问；也可以使用for inputs,labels in enumerate(dataloader)形式访问，但是enumerate和iter的区别是什么呢？暂时不明白。补充：如下代码形式调用enumerate...

pytroch dataloader配合tqdm

qq_15054345的博客

07-27

1991

代码如下： with tqdm(dataloader, desc=self.stage_name, file=sys.stdout, disable=not (self.verbose)) as iterator: for x, y in iterator: x, y = x.to(self.device), y.to(self.device) loss, y_pred = self.batch_update(x,

深度学习的知识点与python知识点三，tqdm与dataloader组合输出数据训练进度，ArgumentParser修改默认值

yangdeshun888的博客

08-30

3386

1、tensorflow里的四种交叉熵的实现跟计算：注意：tensorflow交叉熵计算函数输入中的logits都不是softmax或sigmoid的输出，而是softmax或sigmoid函数的输入，因为它在函数内部进行sigmoid或softmax操作 tf.nn.sigmoid_cross_entropy_with_logits(_sentinel=None,labels=None,...

记录如何加载多个dataloader同时训练，来源于不同数据集的dataloader，并解决tqdm与zip一起使用的问题

zhENGHAOSTU的博客

10-26

2079

记录如何加载多个dataloader同时训练，来源于不同数据集的dataloader，并解决tqdm与zip一起使用的问题

用tdqm在batch情况下的dataloader联合使用可视化进度

蛋总的快乐生活

08-18

4160

最近在用dataloader写数据集，在使用tqdm的时候遇见了一些问题，经过查找大量的资料，总结一个简单的方法。首先，先设置网络的输入和输出，假设这两个量已经是tensor类型了。输入：tensor_x 输出：tensor_y 那么导入这个库函数 from torch.utils.data import DataLoader, TensorDataset dataset = TensorDataset(tensor_x, tensor_y) loader = DataLoader(datas.

Dataset 和 Dataloader 详解

@bangbang的博客

11-24

3350

(1)处理变长序列如果一个批次的数据具有不同长度，例如 NLP 中的句子或时间序列，默认的 collate_fn 会报错。需要自定义逻辑，使用填充（padding）或其他方法统一长度(2)支持复杂数据结构默认的 default_collate 无法处理某些类型的数据，例如自定义嵌套数据或稀疏数据，需要编写自定义逻辑。(3)特殊预处理在将数据输入模型前，可能需要动态调整或预处理（例如数据增强、归一化等）。

重学PyTorch，粗略笔记（二）dataset，dataloader

ziggybowie的博客

07-16

1487

自定义的数据集类必须实现三个函数：initlen, 和getitemgetitem从数据集中给定的索引 idx 处加载并返回一个样本函数len返回我们数据集中的样本数。# # 下载 Fashion MNIST 数据集# # 解压 gz 文件# # 读取二进制文件并转换为 numpy 数组import os# 下载 Fashion MNIST 数据集# 解压 gz 文件# 读取二进制文件并转换为 numpy 数组# 保存 numpy 数组到文件# 加载保存的 numpy 数组。

Python学习之路：Dataset、DataLoader自定义数据集

Sirius小狼的博客

09-17

2555

#encoding:UTF-8 import torch from torch.utils.data import Dataset, DataLoader import torchvision.transforms as transforms import cv2 import os import numpy as np device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") # step1: 定义MyDatase.

tqdm库的总结

wuruoting_claire的博客

10-29

1703

tqdm的一些常用操作总结。

tqdm类库

duoyasong5907的博客

10-29

1097

tqdm

pytorch bug: for step,data in enumerate(loader)+Connection reset by peer

weixin_30680385的博客

03-28

1122

单GPU跑的程序，而且是在docker中，迭代了几百步后，程序突然崩掉了，程序停在了 for step,data in enumerate(loader)，下面是部分bug信息 Traceback (most recent call last): ........ File ".../torch/utils/data/dataloader.py", line 206, in...

Python技巧---tqdm库的使用

打工人。。

09-15

3720

可以看到有描述性信息，进度条，已经运行了多少时间，还差多少时间，速度。在之后还可以添加后缀描述，见下面。一般都是在train函数中使用tqdm，讲dataloader做为一个可迭代对象传入tqdm。“tqdm” 是一个 Python 库，用于在命令行界面中创建进度条。只介绍传入的三个参数：iterable, desc, total。iterable:是一个可迭代对象。desc：进度条前的描述性信息。total：可迭代对象的长度。

pytorch：关于enumerate，Dataset和Dataloader

weixin_42402402的博客

08-17

4202

数据读取机制在对Dataloader进行读取时，通常使用enumerate函数，enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标。例如：for k, batch in enumerate(loader): 其中，k代表下标值，batch代表可遍历的数据对象，通常，loader里包含很多个数据对象，那么我们应该怎么保证batch就是我们所需要的数据呢？通过Dataset的定义可以实现我们需要的数据。Dataset是用来定义数据从哪里

【python第三方库】tqdm——超详细解读