p14 fashion-mnist数据集
mnist数据集是一个非常出名的用于训练机器学习的图像处理系统的数据集,这个数据集是由七万张手写的数字图像组成
p15 torchvision——提取、转换、加载流程
torchvision是pytorch的用于深度学习的计算机视觉包
四个步骤:
1、准备数据:E-T-L 提取(extract)-转换(transfrom)-加载(load)
2、构建模型:
3、训练模型、
4、分析模型结果
- 准备数据
extract:从源获取fashion-mnist数据
transform:将图像数据转换成一个pytorch张量
load:将数据放入一个使其易于访问的对象中
pytorch提供了两个类:dataset数据集、dataloader数据加载器
dataset数据集:torch.utils.data.Dataset
dataloader数据加载器:torch.utils.data.DataLoader
torchvision可以让我们接触到四个东西:dataset、models(比如vgg-16或其他的模型)、transform、utils实用程序
torchvision中fashion-mnist的源码:
fashion-mnist是mnist的替换,唯一需要改变的是交换url
使用torchvision获得一个fashion-mnist数据集的实例:
p16 熟悉训练集及其中的数据
记住,我们有两个pytorch对象,数据集(也称训练集)和数据加载器(也称加载器)
bincount()得出fashion-mnist数据集与对应的每个类的样本数是一致的,如果每类有不同数量的样本,我们将称这个数据集为不平衡的数据集
训练集对象传递给python的内置函数,iter():他返回一个表示数据流的对象,然后可以进行迭代。
next():有了大量的数据之后,可以使用python构建的next()函数来获取流中的下一个数据元素。
可以看到实例中包含两个项目。
数据集中包含的是图像标签对,我们从训练集中获取的每个样本都包含图像数据张量,以及相应的标签张量image, label = sample à image = sample[0] label = sample[1]
打印出一张图片:
gray:表示只有一个颜色通道,灰色通道
这时有一个高度和宽度分别为28的通道,标签是一个标量值,所以有一个没有形状的标量张量(label:9&#