Pytorch中DataLoader的使用

最新推荐文章于 2024-07-06 14:11:57 发布

kahuifu

最新推荐文章于 2024-07-06 14:11:57 发布

阅读量5.4w

点赞数 76

分类专栏： pytorch

本文链接：https://blog.csdn.net/kahuifu/article/details/108654421

版权

本文介绍了在PyTorch中如何使用DataLoader处理数据。首先从前言引入，然后详细讲解了数据加载的步骤，包括创建dataset对象和dataloader对象。在dataset部分，提到了需要定义包含`__init__`、`__len__`和`__getitem__`函数的类来处理数据。在dataloader部分，解释了参数`shuffle`和`collate_fn`的作用，特别是如何利用`collate_fn`对每个batch的数据进行填充以适应不同长度的输入。最后，建议初学者通过打印数据进行检查以确保数据处理正确。

摘要由CSDN通过智能技术生成

前言

最近开始接触pytorch，从跑别人写好的代码开始，今天需要把输入数据根据每个batch的最长输入数据，填充到一样的长度（之前是将所有的数据直接填充到一样的长度再输入）。
刚开始是想偷懒，没有去认真了解输入的机制，结果一直报错…还是要认真学习呀！

加载数据

pytorch中加载数据的顺序是：
①创建一个dataset对象
②创建一个dataloader对象
③循环dataloader对象，将data,label拿到模型中去训练

dataset

你需要自己定义一个class，里面至少包含3个函数：
①__init__：传入数据，或者像下面一样直接在函数里加载数据
②__len__：返回这个数据集一共有多少个item
③__getitem__:返回一条训练数据，并将其转换成tensor

import torch
from torch.utils.data import Dataset
class Mydata(Dataset):
    def __init__(self):
        a = np.load("D:/Python/nlp/NRE/a.npy",allow_pickle=True)
        b = np.load("D:/Python/nlp/NRE/b.npy",allow_pickle=True)
        d = np.load("D:/Python/nlp/NRE/d.npy",allow_pickle=True)
        c = np.load("D:/Python/nlp/NRE/c.npy")
        self.x = list(zip(a,b,d,c))
    def __getitem__(self, idx):
        
        assert idx < len(

最低0.47元/天解锁文章

kahuifu

关注

76
点赞
踩
301

收藏

觉得还不错? 一键收藏
1
评论
Pytorch中DataLoader的使用

前言最近开始接触pytorch，从跑别人写好的代码开始，今天需要把输入数据根据每个batch的最长输入数据，填充到一样的长度（之前是将所有的数据直接填充到一样的长度再输入）。刚开始是想偷懒，没有去认真了解输入的机制，结果一直报错…还是要认真学习呀！加载数据pytorch中加载数据的顺序是：①创建一个dataset对象②创建一个dataloader对象③循环dataloader对象，将data,label拿到模型中去训练dataset你需要自己定义一个class，里面至少包含3个函数：①_
复制链接

扫一扫

专栏目录