计算机视觉：CIFAR-10 和 CIFAR-100

00&00

于 2025-01-09 11:50:28 发布

阅读量1.4k

点赞数 22

分类专栏：深度学习人工智能文章标签：计算机视觉人工智能

本文链接：https://blog.csdn.net/Wei_sx/article/details/145028962

版权

人工智能同时被 2 个专栏收录

223 篇文章

订阅专栏

深度学习

82 篇文章

订阅专栏

CIFAR-10 和 CIFAR-100 是两个非常重要的图像分类数据集，广泛用于深度学习和计算机视觉领域的研究和实验。以下是针对这两个数据集的更详细的介绍，包括其特性、应用场景、数据预处理和模型训练的细节。

一、CIFAR-10

1. 详细描述

数据量：60,000 张彩色图像，每张图像大小为 32x32 像素。
分布：
50,000 张训练图像
10,000 张测试图像
类别：分为 10 个类，每类 6,000 张图像
列别1：飞机 (airplane)
类别2：汽车 (automobile)
类别3：鸟 (bird)
类别4：猫 (cat)
类别5：鹿 (deer)
类别6：狗 (dog)
类别7：青蛙 (frog)
列别8：马 (horse)
类别9：船 (ship)
列别10：卡车 (truck)

2. 特性

图像明亮并且小巧，适合初学者和快速实验。
每个类别的图像具有多样性，且有一定的重叠特性，增加了分类的挑战性。

二、CIFAR-100

1. 详细描述

数据量：与 CIFAR-10 相同，包含 60,000 张图像，每张图像大小为 32x32 像素。
分布：
        50,000 张训练图像
        10,000 张测试图像
类别：CIFAR-100 按 100 个类进行分类，每类 600 张图像，且这些类别被分为 20 个超类，每个超类对应 5 个子类。以下是部分超类的示例：
        水果和蔬菜：
                苹果(apple)
                橙子 (orange)
        动物：
                蛇 (snake)
                山羊 (goat)
        交通工具：
                飞机(airplane)
                汽车 (automobile)

2. 特性

相较于 CIFAR-10，CIFAR-100 提供了更大的类别数量和复杂性，适合高级实验和深度学习模型的基准测试。
数据集涵盖更广泛的视觉对象，增加了任务的难度和学习的挑战。

三、使用场景

        机器学习实验：这两个数据集广泛用于卷积神经网络（CNN）等深度学习体系结构的验证，尤其是针对图像分类任务。
        基准测试：研究人员和开发人员可以使用这两个数据集来比较不同模型的性能，作为标准测试集。
        教学和培训：由于其简单性，这两个数据集常被用于教学或为初学者提供实际的图像识别任务。

四、下载数据集

您可以通过以下链接获取 CIFAR-10 和 CIFAR-100 数据集：

CIFAR-10: [下载链接](https://www.cs.toronto.edu/~kriz/cifar.html)
CIFAR-100: [下载链接](https://www.cs.toronto.edu/~kriz/cifar.html)

五、代码示例

1. 加载和预处理数据

以下代码演示如何使用 TensorFlow/Keras 加载 CIFAR-10 数据集，并进行简单的预处理：

import tensorflow as tf  
from tensorflow.keras import datasets  

# 加载 CIFAR-10 数据集  
(x_train, y_train), (x_test, y_test) = datasets.cifar10.load_data()  

# 数据预处理：将像素值缩放到 [0,1] 范围  
x_train = x_train.astype('float32') / 255.0  
x_test = x_test.astype('float32') / 255.0  

# 检查数据的形状  
print(f'训练数据形状: {x_train.shape}, 标签形状: {y_train.shape}')  
print(f'测试数据形状: {x_test.shape}, 标签形状: {y_test.shape}')  

# 可视化部分图像  
import matplotlib.pyplot as plt  

def visualize_data(images, labels, num=10):  
    plt.figure(figsize=(15, 3))  
    for i in range(num):  
        plt.subplot(2, 5, i + 1)  
        plt.imshow(images[i])  
        plt.title(f'Label: {labels[i][0]}')  
        plt.axis('off')  
    plt.show()  

visualize_data(x_train, y_train, 10)

2. 模型训练示例

以下是一个使用卷积神经网络（CNN）进行 CIFAR-10 数据集训练的示例代码：

from tensorflow.keras import layers, models  

# 构建 CNN 模型  
model = models.Sequential([  
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),  
    layers.MaxPooling2D(pool_size=(2, 2)),  
    layers.Conv2D(64, (3, 3), activation='relu'),  
    layers.MaxPooling2D(pool_size=(2, 2)),  
    layers.Conv2D(64, (3, 3), activation='relu'),  
    layers.Flatten(),  
    layers.Dense(64, activation='relu'),  
    layers.Dense(10, activation='softmax')  # 对于 CIFAR-10，输出类别数为 10  
])  

# 编译模型  
model.compile(optimizer='adam',  
              loss='sparse_categorical_crossentropy',  
              metrics=['accuracy'])  

# 训练模型  
model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))

# 保存模型  
model.save('image_classification_model.h5')