PyTorch DataLoader

最新推荐文章于 2024-02-24 08:44:55 发布

东方小烈

最新推荐文章于 2024-02-24 08:44:55 发布

阅读量173

点赞数

分类专栏： deep learning PyTorch 文章标签： pytorch 深度学习自然语言处理图像处理 DataLoader

本文链接：https://blog.csdn.net/dongfangxiaozi_/article/details/110534807

版权

PyTorch 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

deep learning

6 篇文章 0 订阅

订阅专栏

在使用PyTorch时，经常需要自己写DataLoader，写DataLoader前需要先写Dataset，通常情况可能需要给定一个file_path动态加载，这里先定义一个X和Y。

Dataset类需要实现__getitem__和__len__两个函数


from torch.utils.data.dataloader import DataLoader
from torch.utils.data.dataset import Dataset
import torch.utils.data as Data
import torch


class MyDataSet(Dataset):
    def __init__(self, file_path):
        super().__init__()
        self.X = torch.randn(20)
        self.Y = torch.linspace(1, 10, 20)
        self._len = len(self.X)
        pass
    def __getitem__(self, idx):
        return (self.X[idx], self.Y[idx])
    
    def __len__(self):
        return self._len

我们测试下刚刚的Dataset并建立DataLoader，DataLoader的好处是可以一次生成batch个数据，方便训练和计算。

data_set = MyDataSet('')

data_loder = DataLoader(dataset=data_set, batch_size=6, shuffle=True)

for batch in data_loader:
    print(batch)

会得到类似这样的输出：

----------------------
[tensor([6., 4., 3.]), tensor([5., 7., 8.])]
[tensor([ 2.,  5., 10.]), tensor([9., 6., 1.])]
[tensor([7., 1., 9.]), tensor([ 4., 10.,  2.])]
[tensor([8.]), tensor([3.])]

-------------------------------------

[tensor([7., 3., 9.]), tensor([4., 8., 2.])]
[tensor([4., 6., 1.]), tensor([ 7.,  5., 10.])]
[tensor([ 5.,  8., 10.]), tensor([6., 3., 1.])]
[tensor([2.]), tensor([9.])]

东方小烈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch DataLoader

在使用PyTorch时，经常需要自己写DataLoader，写DataLoader前需要先写Dataset，通常情况可能需要给定一个file_path动态加载，这里先定义一个X和Y。Dataset类需要实现__getitem__和__len__两个函数from torch.utils.data.dataloader import DataLoaderfrom torch.utils.data.dataset import Datasetimport torch.utils.data as D
复制链接

扫一扫