深度学习基础14(softmax回归数据集的选择以及读取)

图像分类数据集

MNIST数据集是图像分类中广泛使用的数据集之一,是对手写数字的识别,大概86年提出的

但作为基准数据集过于简单。

我们将使用类似但更复杂的Fashion-MNIST数据集

%matplotlib inline
import torch
import torchvision  #是pytorch对于计算机视觉实现的一个库
from torch.utils import data#方便读取数据一些小批量的函数
from torchvision import transforms#对数据操作的模具导入进来
from d2l import torch as d2l#将一些函数实现好之后存在d2l里面

d2l.use_svg_display()#用svg来显示我们的图片,这样子清晰度高一点

读取数据集

可以通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中

# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数格式,
# 并除以255使得所有像素的数值均在0到1之间
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.FashionMNIST(#从torchvision.datasets里面把FashionMNIST拿到
    root="../data", train=True, transform=trans, download=True)#"../data"下载到上级目录的data下面,train=True下载的是训练数据集,transform=trans是说我们拿出来之后我们需要得到的是一个pytorch的tensor而不是一堆图片,download=True意思是我们默认从网上下载
mnist_test = torchvision.datasets.FashionMNIST(
    root="../data", train=False, transform=trans, download=True)#train=False下载的是测试集

Fashion-MNIST由10个类别的图像组成, 每个类别由训练数据集(train dataset)中的6000张图像 和测试数据集(test dataset)中的1000张图像组成。

因此,训练集和测试集分别包含60000和10000张图像。 测试数据集不会用于训练,只用于评估模型性能。

len(mnist_train), len(mnist_test)(60000, 10000)

(60000, 10000)

每个输入图像的高度和宽度均为28像素。 数据集由灰度图像组成,其通道数为1。

将高度ℎ像素、宽度𝑤像素图像的形状记为ℎ×𝑤或(ℎ,w)。

mnist_train[0]
  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

NDNPOMDFLR

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值