PyTorch入门教学——torchvision中数据集的使用

1、torchvision.datasets

2、使用

  • 这里以使用CIFAR10中的数据为例。
  • 其中有这个数据集的使用方法和具体介绍。
  • 参数:(每个数据集的参数大致相同)
    • root:数据集下载后存放的目录。
    • train:如果为True,则从训练集创建数据集,否则从测试集创建。
    • transform:接收PIL图像的转换方式,并返回转换后的版本。
    • download:如果为True,则从互联网下载数据集,然后将其放在设置的目录中。如果数据集已下载,则不会再次下载。
  • 代码演示——查看数据集中图片的信息
    • import torchvision
      
      train_set = torchvision.datasets.CIFAR10(root="./Dataset/CIFAR10", train=True, download=True)  # root:数据集要存放在什么位置
      test_set = torchvision.datasets.CIFAR10(root="./Dataset/CIFAR10", train=False, download=True)
      
      print(test_set[0])  # 第一张图片的信息,包含格式和标签
      print(test_set.classes)  # 数据集中所包含的图片类别
      
      img, target = test_set[0]
      print(img)
      print(target)  # 标签
      print(test_set.classes[target])  # 第一张图片的标签为猫
      img.show()  # 显示图片
  • 代码演示——将数据集中的前10张图片在tensorboard中展示出来。
    • import torchvision
      from torch.utils.tensorboard import SummaryWriter
      
      test_set = torchvision.datasets.CIFAR10(
          root="./Dataset/CIFAR10",
          transform=torchvision.transforms.ToTensor(),  # 将图片转换为totensor数据类型
          train=False,
          download=True)
      
      writer = SummaryWriter('logs')  # writer把summary内容写在哪个目录下
      for i in range(10):
          img, target = test_set[i]
          writer.add_image('test_set', img, i)
      
      writer.close()
    • 运行程序后,打开终端,输入下列命令打开tensorboard。
    • tensorboard --logdir=logs --port=6007
    • (该数据集的图片像素为32*32,所以比较模糊)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
首先,让我们先下载并导入 `torchvision` 和 `matplotlib` 库: ```python import torch import torchvision import matplotlib.pyplot as plt ``` 然后,我们可以使用以下代码加载 CIFAR10 数据集: ```python transform = torchvision.transforms.Compose([ torchvision.transforms.ToTensor(), torchvision.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) train_dataset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) test_dataset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) ``` 在这里,我们定义了一个转换器,用于将 PIL 图像转换为 PyTorch 张量,并对像素值进行归一化。然后,我们使用 `torchvision.datasets.CIFAR10` 类加载数据集,`train=True` 表示加载训练集,`train=False` 表示加载测试集。`root` 参数指定数据集存储的文件夹,`download=True` 表示自动下载数据集。 接下来,我们可以使用以下代码显示数据集的一些示例图像: ```python classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck') def imshow(img): img = img / 2 + 0.5 # 非归一化 npimg = img.numpy() plt.imshow(np.transpose(npimg, (1, 2, 0))) plt.show() dataiter = iter(trainloader) images, labels = dataiter.next() imshow(torchvision.utils.make_grid(images)) print(' '.join('%5s' % classes[labels[j]] for j in range(4))) ``` 在这里,我们首先定义了一个 `classes` 列表,包含 CIFAR10 的所有类别。然后,我们定义了一个函数 `imshow()`,用于显示图像。我们从训练集加载一批数据,并使用 `torchvision.utils.make_grid()` 函数将这些图像合并为一个网格。最后,我们使用 `plt.imshow()` 函数显示图像。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

恣睢s

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值