PyTorch 中的数据类型 torch.utils.data.DataLoader

rogerfang

于 2018-09-02 02:11:45 发布

阅读量4.2w

点赞数 78

文章标签： PyTorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rogerfang/article/details/82291464

版权

DataLoader是PyTorch中的一种数据类型。

在PyTorch中训练模型经常要使用它，那么该数据结构长什么样子，如何生成这样的数据类型？

下面就研究一下：

先看看 dataloader.py脚本是怎么写的（VS中按F12跳转到该脚本）

__init__（构造函数）中的几个重要的属性：

1、dataset：（数据类型 dataset）

输入的数据类型。看名字感觉就像是数据库，C#里面也有dataset类，理论上应该还有下一级的datatable。这应当是原始数据的输入。PyTorch内也有这种数据结构。这里先不管，估计和C#的类似，这里只需要知道是输入数据类型是dataset就可以了。

2、batch_size：（数据类型 int）

每次输入数据的行数，默认为1。PyTorch训练模型时调用数据不是一行一行进行的（这样太没效率），而是一捆一捆来的。这里就是定义每次喂给神经网络多少行数据，如果设置成1，那就是一行一行进行（个人偏好，PyTorch默认设置是1）。

3、shuffle：（数据类型 bool）

洗牌。默认设置为False。在每次迭代训练时是否将数据洗牌，默认设置是False。将输入数据的顺序打乱，是为了使数据更有独立性，但如果数据是有序列特征的，就不要设置成True了。

4、co

最低0.47元/天解锁文章

关注

78
点赞
踩
280

收藏

觉得还不错? 一键收藏
17
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

rogerfang CSDN认证博客专家 CSDN认证企业博客

码龄9年

6: 原创

32万+: 周排名

192万+: 总排名

11万+: 访问

: 等级

592: 积分

15: 粉丝

169: 获赞

40: 评论

693: 收藏

私信

关注

最新评论

C# 线程间不能调用剪切板的解决方法
CSDN-Ada助手: 非常感谢您的分享，这篇博客对我们学习C#编程来说非常有用。我觉得您可以继续写一个针对多线程编程的技术文章，可以深入探讨如何在C#中有效地管理多线程并发，以及如何避免一些常见的多线程编程问题。这样的技术文章对其他用户也一定会非常有帮助，期待您的下一篇作品。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
PyTorch 中的 LSTM模型参数解释
panbaoran913: 我想知道反向传播，训练lstm的步骤
PyTorch 中的 LSTM模型参数解释
it_s_tart: 可以请问一下这个参数量的意义是什么吗？有什么作用
PyTorch 中的 LSTM模型参数解释
堃昕彧懿翾: 是不是类似于特征的个数？
PyTorch 中的数据类型 torch.utils.data.DataLoader
qq_43334087: 你好，我想问一下DataLoader类生成的对象之所以可以放在for in后面迭代是不是正是因为类中定义了__iter__(self)这一魔法方法？

最新文章

目录

评论 17

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。