ps:在修改代码时,之前研究过一些数据集可以通过代码在训练的时候进行下载,刚刚得知这些数据集是torch中内置的数据集,想自己总结记录一下
Torchvision 中的数据集:
MNIST:
手写图像组成的数据集,60,000 张训练图像和 10,000 张测试图像(也是联邦学习实验中经常使用的数据集)在训练的时候很容易达到很高的精度
train_dataset = datasets.MNIST(data_dir, train=True, download=True,
transform=apply_transform)
test_dataset = datasets.MNIST(data_dir, train=False, download=True,
transform=apply_transform)
Fashion MNIST:
类似于mnist数据集,是一组28x28灰度的衣服图像,训练和测试样本数分别为60,000和10,000
CIFAR:
CIFAR10和CIFAR100。CIFAR10 由 10 个不同标签的图像组成,而 CIFAR100 有 100 个不同的类。这些包括常见的图像,如卡车、青蛙、船、汽车、鹿等。
train_dataset = datasets.CIFAR10(data_dir, train=True, download=True,
transform=apply_transform)
test_dataset = datasets.CIFAR10(data_dir, train=False, download=True,
transform=apply_transform)
COCO:
COCO数据集包含超过 100,000 个日常对象,如人、瓶子、文具、书籍等
EMNIST:
包括数字和字母的图像组成。适合处理从图像中识别文本
IMAGE-NET:
分布在 10,000 个类别中的超过 120 万张图像组成