第八节课课堂总结

Pytorch数据处理工具箱

 

数据处理工具箱概述

1.utils.data.Dataset

2.DataLoader:可以批量处理。相关参数介绍如下所示。

dataset

加载的数据集。

batch_size

批大小。

shuffle

是否将数据打乱。

sampler

样本抽样。

num_workers

使用多进程加载的进程数,0代表不使用多进程。

collate_fn

如何将多个样本数据拼接成一个batch,一般使用默认的拼接方式即可。

pin_memory

是否将数据保存在锁页内存(pin memory区),其中的数据转到GPU会快一些。

drop_last

dataset 中的数据个数可能不是 batch_size的整数倍,drop_last为True会将多出来不足一个batch的数据丢弃。

2.DataLoader:可以批量处理。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值