- 在https://pytorch.org/vision/stable/datasets.html中存在很多官方数据集
- 使用示例(CIFAR10数据集使用)
'''
1. root (str 或 `pathlib.Path` ) – 数据集的根目录 `cifar-10-batches-py` ,如果 download 设置为 True,则该目录存在或将保存到其中
2. train (bool, optional) – 如果为 True,则从训练集创建数据集,否则从测试集创建数据集。
3. transform (callable, optional) – 接受 PIL 图像并返回转换后的版本的函数/转换。例如, `transforms.RandomCrop`
4. target_transform (callable, optional) – 接收目标并对其进行转换的函数/转换。
5. download (bool, 可选) – 如果为 true,则从 Internet 下载数据集并将其放在根目录中。如果已下载数据集,则不会再次下载。
'''
torchvision.datasets.CIFAR10(root:Union[str,Path], train:bool=True, transform:Optional[Callable]=None, target_transform:Optional[Callable]=None, download:bool=False)
- 代码示例
import torchvision
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,download=True)
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,download=True)
print(test_set[0])
print(test_set.classes)
img,target = test_set[0]
print(img)
print(target)
- 将获取到的图片进行格式转换
import torchvision
datasets_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,transform=datasets_transform,download=True)
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=datasets_transform,download=True)