CIFRA-10数据集介绍:https://blog.csdn.net/weixin_41028208/article/details/85145776
CIFRA-10数据集结构
以Python加载,每个批处理文件都包含一个字典,包含以下elements:
- data
- 一个 10000x3072 的uint8s numpy数组。矩阵的每一行都存储一个32x32的彩色图像。前1024个条目包含红色通道值,下一个1024表示绿色,最后1024个表示蓝色。图像以行主顺序存储,因此数组的前32个条目是图像第一行的红色通道值。
- labels
- 0-9范围内的10000个数字列表。索引i处的数字表示阵列数据中第i个图像的标签。
数据集包含另一个名为batches.meta的文件。它也包含一个Python dictionary 对象。它有以下条目:
- label_names
- 一个10元素列表,为上述标签数组中的数字标签提供有意义的名称。例如,
label_names[0]=="airplane",label_names [1]=="cars"
等。
- 一个10元素列表,为上述标签数组中的数字标签提供有意义的名称。例如,
代码部分
# 读取训练集
images, labels = [], []
for filename in ['%s/data_batch_%d' % (directory, j) for j in range(1, 6)]:
with ope