目录
一、Torchvision中数据集的使用
1.Dataset模块
Pytorch官网->docs->pytotch Domains->torchvision->datasets->左上角版本改为0.9.0
2.models模块:提供了一些预训练模型
3.CIFAR10数据集基础知识
①参数介绍:
②下载数据集
import torchvision
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,download=True)
test_set = torchvision.datasets.CIFAR10(root = "./dataset",train=False,download=True)
(下载慢复制下载链接,复制到迅雷)
③查看数据集:
a.查看某个元素
#查看dataset
print(test_set[0])
结果:
b.了解具体组成: 每一个trainset都是一个(图片,label)的元组
print(test_set.classes)
img,target = test_set[0]
print(img)
print(target)
输出:
c.输出数据集具体的类别
#输出具体类别,看看数字3对应的是哪一类
print(test_set.classes[target])
img.show()
结果:
4.完整使用数据集代码
转化为totensor型并且用tensorboard打开:
import torchvision
from torch.utils.tensorboard import SummaryWriter
#第一步用Compose转化为totensor
dataset_transform = torchvision.transforms.Compose([
torchvision.transforms.ToTensor()
])
#第二步修改这里的transform参数
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,transform=dataset_transform,download=True)
test_set = torchvision.datasets.CIFAR10(root = "./dataset",train=False,transform=dataset_transform,download=True)
print(test_set[0])
#用tensorboard显示:
writer = SummaryWriter("p10")
for i in range(10):
img,target = test_set[i]
writer.add_image('test_set',img,i)
writer.close()
结果显示:
5.COCO数据集
①参数:
②迅雷下载后怎么办:
新建dataset文件,复制tar.gz文件,进入pycharm,粘贴到文件夹下边,运行后,python自动校验,压缩文件解压为数据集,所以download一直设置为True比较方便
③找不到数据集下载网址怎么办:
ctrl点击数据集名称,进入源代码,找到url链接,复制粘贴