对于深度学习来说,数据,算法,基础计算硬件是三个非常重要的部分。
在使用数据之前,了解好数据的相关信息是很有必要的。
一般发布一个开源的数据集都可以找到介绍的论文。
这次使用的是FashionMNIST数据集进行学习。
FashionMNIST的创造者是打算代替MNIST数据集,其在保持MNIST的10个类别的情况下使用的是不同种类的衣服来代替手写的数字,从而增加了一定的难度。
准备数据的过程可以分为三个阶段:
E.(extract)从源数据中提取出数据
T.(transform)把数据转换成想要的格式
L.(load)将数据加载进合适的结构当中
pytorch提供了一些包和类来使这三个过程变得简单起来
import torchvision
import torchvision.transforms as transforms
torchversion提供了获取一些热门的数据集,模型,图像转换的方法
torchvision.transforms则是包含了一些图像处理的转换接口
使用pytorch准备数据的过程
1.E:从给定的URL处获取Fashion-MNIST的图像数据
2.T:将数据转化为张量的形式