Pytorch深度学习-torchvision中的数据集使用(小土堆)

最新推荐文章于 2024-10-12 20:31:18 发布

Mr chenxizhi

最新推荐文章于 2024-10-12 20:31:18 发布

阅读量112

点赞数 2

文章标签：深度学习 pytorch 人工智能 python

本文链接：https://blog.csdn.net/weixin_53141706/article/details/140275633

版权

在https://pytorch.org/vision/stable/datasets.html中存在很多官方数据集
使用示例(CIFAR10数据集使用)

'''
1. root （str 或 `pathlib.Path` ） – 数据集的根目录 `cifar-10-batches-py` ，如果 download 设置为 True，则该目录存在或将保存到其中
2. train （bool， optional） – 如果为 True，则从训练集创建数据集，否则从测试集创建数据集。
3. transform （callable， optional） – 接受 PIL 图像并返回转换后的版本的函数/转换。例如， `transforms.RandomCrop`
4. target_transform （callable， optional） – 接收目标并对其进行转换的函数/转换。
5. download （bool， 可选） – 如果为 true，则从 Internet 下载数据集并将其放在根目录中。如果已下载数据集，则不会再次下载。
'''
torchvision.datasets.CIFAR10（root：Union[str，Path]， train：bool=True， transform：Optional[Callable]=None， target_transform：Optional[Callable]=None， download：bool=False）

代码示例

import torchvision  
  
#下载地址为本目录的dataset文件夹下  
#因为train为true所以从训练集下载数据  
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,download=True)  
#因为train为false所以从测试集下载数据  
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,download=True)

print(test_set[0])
#获取数据集特征名  
print(test_set.classes)  
#使用img获取数据集的图片，使用target获取目标值名  
img,target = test_set[0]  
print(img)  
print(target)

将获取到的图片进行格式转换

#这里转换主要是设置了一个转换器并将其放置于Compose中，设置为一个转换器，并传入在数据获取的参数之中
import torchvision  
datasets_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])  
#下载地址为本目录的dataset文件夹下  
#因为train为true所以从训练集下载数据  
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,transform=datasets_transform,download=True)  
#因为train为false所以从测试集下载数据  
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=datasets_transform,download=True)