Torch_3_Dataset与Dataloader

最新推荐文章于 2024-06-20 12:03:16 发布

aaaaaaze

最新推荐文章于 2024-06-20 12:03:16 发布

阅读量504

点赞数 1

分类专栏： Path2DL 文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/aaaaaaze/article/details/124488291

版权

Path2DL 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文介绍了PyTorch中用于训练模型的数据加载方式，包括自定义`Dataset`子类来处理数据集，以及使用`DataLoader`进行批量数据加载。示例展示了如何从numpy文件读取数据，并在训练过程中通过迭代`DataLoader`获取批次数据。这种方式统一了数据输入，提高了代码可读性和易用性。

摘要由CSDN通过智能技术生成

torch中的data迭代方法

介绍

看代码的过程中不难发现，不同作者模型训练时的数据输入方法差别非常大。
torch提供了统一的接口，通过迭代器实现数据和标签的读取，使用方便也利于阅读。

实现方法

导入

from torch.utils.data import Dataset, DataLoader

Dataset

torch内置抽象类，无法实例化，通过继承并重写魔术方法实现

class MyDataset(Dataset):
    def __init__(self, filepath):
        xy = np.load(filepath)
        self.len = xy.shape[0]
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    def __getitem__(self, item):
        return self.x_data[item], self.y_data[item]

    def __len__(self):
        return self.len

dataset = MyDataset('MyData.npy')

示例中，以读取numpy文件为例，通过重写__getitem__，__len__方法，实现数据的随机读取

Dataloader

调用dataset 实例，通过设定的参数可生成DataLoader

train_loader = DataLoader(dataset=dataset, batch_size=32, shuffle=True, num_workers=2)

训练中调用数据

for i, data in enumerate(train_loader, 0):  #
		x, y = data

aaaaaaze

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录