PyTorch入门教学——torchvision中数据集的使用

最新推荐文章于 2023-11-24 19:11:22 发布

恣睢s

最新推荐文章于 2023-11-24 19:11:22 发布

阅读量677

点赞数

分类专栏： PyTorch 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/weixin_45100742/article/details/134078646

版权

PyTorch 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

1、torchvision.datasets

datasets是torchvision工具集中的一个工具。
可以理解为调用官方数据集的一种方式，其中有很多开源的数据集，可供我们学习使用。
datasets官网：Datasets — Torchvision 0.16 documentation (pytorch.org)

2、使用

这里以使用CIFAR10中的数据为例。
其中有这个数据集的使用方法和具体介绍。
参数：（每个数据集的参数大致相同）
- root：数据集下载后存放的目录。
- train：如果为True，则从训练集创建数据集，否则从测试集创建。
- transform：接收PIL图像的转换方式，并返回转换后的版本。
- download：如果为True，则从互联网下载数据集，然后将其放在设置的目录中。如果数据集已下载，则不会再次下载。

代码演示——查看数据集中图片的信息

import torchvision

train_set = torchvision.datasets.CIFAR10(root="./Dataset/CIFAR10", train=True, download=True)  # root：数据集要存放在什么位置
test_set = torchvision.datasets.CIFAR10(root="./Dataset/CIFAR10", train=False, download=True)

print(test_set[0])  # 第一张图片的信息，包含格式和标签
print(test_set.classes)  # 数据集中所包含的图片类别

img, target = test_set[0]
print(img)
print(target)  # 标签
print(test_set.classes[target])  # 第一张图片的标签为猫
img.show()  # 显示图片

代码演示——将数据集中的前10张图片在tensorboard中展示出来。

import torchvision
from torch.utils.tensorboard import SummaryWriter

test_set = torchvision.datasets.CIFAR10(
    root="./Dataset/CIFAR10",
    transform=torchvision.transforms.ToTensor(),  # 将图片转换为totensor数据类型
    train=False,
    download=True)

writer = SummaryWriter('logs')  # writer把summary内容写在哪个目录下
for i in range(10):
    img, target = test_set[i]
    writer.add_image('test_set', img, i)

writer.close()