（5）Pytorch数据处理DataLoader

木槿qwer

已于 2022-12-30 16:13:59 修改

阅读量854

点赞数

分类专栏： pytorch基础知识积累文章标签： pytorch 深度学习 python

于 2022-12-10 16:59:47 首次发布

本文链接：https://blog.csdn.net/lwqian102112/article/details/128257582

版权

pytorch基础知识积累专栏收录该内容

11 篇文章 1 订阅

订阅专栏

Pytorch 数据处理

要点总结
1、功能
Dataset：准备数据集，一般会针对自己的数据集格式重写Dataset，定义数据输入输出格式
Dataloader：用于加载数据，通常不用改这部分内容

2、看代码时请关注
Dataloader中collate_fn 传入的参数，这个参数是 数据以 batch 堆叠的列表
Dataset中getitem对原始数据的处理方式
这份笔记不完善，还需要学习加深（TBD）

举例

train_dataset = CenternetDataset(train_lines, input_shape, num_classes, train = True)
gen = DataLoader(train_dataset, shuffle = shuffle, batch_size = batch_size, num_workers = num_workers, pin_memory=True,drop_last=True, collate_fn=centernet_dataset_collate, sampler=train_sampler)

1、DataLoader

1.1 collate-fn的功能

pytorch中collate_fn函数的使用&如何向collate_fn函数传参 ⭐⭐（这篇博文总结到位！）

dataloader取数据的index，进入dataset的getitem确定读取数据具体内容，然后回到dataloader进行数据堆叠生成batch。（个人理解，不一定准确）

collate_fn用法

collate_fn的用处:
自定义数据堆叠过程
自定义batch数据的输出形式
collate_fn的使用
定义一个以data为输入的函数
输入输出分别与getitem函数和loader调用时对应
——理解不通透，不过没关系，现在至少加深理解多一分了！！！

1.2 可视化加深理解

PyTorch DataLoader工作原理可视化 ⭐
数据加载的形象过程

如何 shuffle 和 loader

TODO

系统学习Pytorch笔记三：Pytorch数据读取机制(DataLoader)与图像预处理模块(transforms)

Dataset中使用transforms

import torchvision.transforms as transforms
self.to_tensor = transforms.ToTensor()   # ?

木槿qwer

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录