P14 torchvision中的数据集的使用
-
P14 torchvision中的数据集的使用
这个数据集,就在torchvision.dataset.CIFAR10…这个母子文件中
-
数据类型的预处理,可以建立一个工具,再放进dataset当中:(第12行是工具,16行中,引用了这个工具),将原来的PIL(CIFAR10默认类型)转为了tensor类型:
-
数据集当中,有的会加入下载地址,在线下载太慢的话,可以找一找,用别的方法下载。
可以运行的结果
# !usr/bin/env python3
# -*- coding:utf-8 -*-
"""
author :24nemo
date :2021年07月07日
"""
import torchvision
from torch.utils.tensorboard import SummaryWriter
dataset_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])
# 后面要对数据做一个预处理,做一次transform的变化,这里的意思是,先建立一个工具,在后面的dataset当中,加入这个工具,直接就可以做预处理了,本例是将原始数据转为tensor类型
# CIFAR数据集中的数据,类型是PIL,需要转为tensor,才能进行处理
train_set = torchvision.datasets.CIFAR10(root="./dataset", train=True, transform=dataset_transform, download=True)
# train_set = torchvision.datasets.CIFAR10(root="./dataset", train=True, transform=dataset_transform, download=False)
test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False, transform=dataset_transform, download=True)
# test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False, transform=dataset_transform, download=False)
print(test_set[0])
print(test_set.classes)
img, target = test_set[0]
print(img)
print(target)
print(test_set.classes[target])
img.show()
print(test_set[0])
writer = SummaryWriter("p10")
for i in range(10):
img, target = test_set[i]
writer.add_image("test_set", img, i)
writer.close()
2023.7.18补充:
- 数据集的下载地址,可以用
Ctrl
点进去,看里面的url
.