pytorch学习笔记（五）——torchvision.datasets数据集的使用

最新推荐文章于 2024-07-23 14:52:41 发布

M762B

最新推荐文章于 2024-07-23 14:52:41 发布

阅读量1.9k

点赞数 1

分类专栏： pytorch 文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/NA_imu/article/details/124445457

版权

pytorch 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了torchvision库在PyTorch中的作用，特别关注其在计算机视觉任务中的数据集处理，如CIFAR10。通过示例展示了如何下载、解压并应用数据转换，同时利用tensorboard展示数据集样本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. torchvision

torchvision是pytorch工程的一部分，主要用于视觉方面的一个包，包括流行的数据集、模型架构和用于计算机视觉的常见图像转换torchvision.transforms
torchvision官网页面（从pytorch官网docs点开）

2. torchvision.datasets常见的数据集

在这里插入图片描述

3. 数据集的使用——以CIFAR10为例

import torchvision

# CIFAR10数据集包括60000张32×32的彩色图片，属于10个类型
from torch.utils.tensorboard import SummaryWriter

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])

# 下载CIFAR10数据集的压缩文件及解压，存储到./dataset路径（分别下训练数据集和测试数据集），并且对数据集中的所有图片做transform转换
train_set = torchvision.datasets.CIFAR10(root="./datasets", train=True, transform=dataset_transform, download=True)
test_set = torchvision.datasets.CIFAR10(root="./datasets", train=False, transform=dataset_transform, download=True)

# 测试输出一下数据集信息
# print(test_set.classes)
# print(test_set[0])
# img, target = test_set[0]
# print(img)
# print(target)
# print(test_set.classes[target])
# img.show()

# 放在tensorboard里展示一下
writer = SummaryWriter("p10")
for i in range(10):
    img, target = test_set[i]
    writer.add_image("test_set", img, i)
writer.close()