DataLoader

深浅卡布星

已于 2023-08-24 14:54:38 修改

阅读量144

点赞数

分类专栏：深度学习文章标签： pytorch

于 2023-08-23 20:11:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hahhahahhaja/article/details/132458463

版权

深度学习专栏收录该内容

16 篇文章 2 订阅

订阅专栏

机器学习的五个步骤：
数据模块——模型——损失函数——优化器——训练
在这里插入图片描述
在实际项目中，如果数据量很大，考虑到内存有限、I/O 速度等问题，在训练过程中不可能一次性的将所有数据全部加载到内存中，也不能只用一个进程去加载，所以就需要多进程、迭代加载，而 DataLoader 就是基于这些需要被设计出来的。DataLoader 是一个迭代器，最基本的使用方法就是传入一个 Dataset 对象，它会根据参数 batch_size 的值生成一个 batch 的数据，节省内存的同时，它还可以实现多进程、数据打乱等处理。
在这里插入图片描述

pytorch的数据读取机制DataLoader包括两个子模块，Sampler模块，主要是生成索引index，DataSet模块，主要是根据索引读取数据。

Dataset是用来解决数据从哪里读取以及如何读取的问题。pytorch给定的Dataset是一个抽象类，所有自定义的Dataset都要继承它，并且复写__getitem__()和__len__()类方法，getitem()的作用是接受一个索引，返回一个样本或者标签。
在这里插入图片描述

系统学习Pytorch笔记三：Pytorch数据读取机制(DataLoader)与图像预处理模块(transforms)
pytorch笔记-数据读取机制DataLoader

深浅卡布星

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DataLoader

Pytorch学习笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。