目录:
目录
PyTorch为我们提供了专门的数据下载、数据处理包,使用这些包可以极大提高我们的开发效率及质量。在数据预处理,数据加载模块使用。
1、Pytorch相关数据处理箱概要
1、 左侧为torch.utils.data工具包,主要包括以下四个类:
1)Dataset:是一个抽象类,其他数据需要继承这个类,并且覆写其中的两个方法(__getitem__、__len__)。
2)DataLoader:定义一个新的迭代器,实现批量(batch)读取,打乱数据(shuffle)并提供并行加速等功能。
3)random_splist:把数据集随机拆分为给定长度的非重叠的新数据集。
4)*Sample:多种采样函数。
2、中间为PyTorch的可视化工具(Torchvision),其是PyTorch的一个视觉处理工具包,独立于Torch需要自主安装。用pip、conda均可安装: