基于CNN的CIFAR10实例

最新推荐文章于 2024-05-13 00:02:45 发布

Artoria____

最新推荐文章于 2024-05-13 00:02:45 发布

阅读量618

点赞数

分类专栏： # Keras 深度学习

本文链接：https://blog.csdn.net/artoria_qzh/article/details/104461228

版权

深度学习同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

Keras

4 篇文章 0 订阅

订阅专栏

文章目录

一、导入数据
二、数据预处理
三、模型的建立与编译
四、模型的训练与预测

一、导入数据

首先先导入CIFAR10数据集

from keras.datasets import cifar10

(X_train, y_train), (X_test, y_test) = cifar10.load_data()

print('图像数据格式：', X_train.shape)
print("训练集：%2.0f，测试集：%2.0f" %(X_train.shape[0], X_test.shape[0]))

在这里插入图片描述

可以看到，训练集有5w个样本，测试集有1w个样本。
且图片格式是32*32的。

由于是彩色图片，所以还会有3个通道（RGB）。

二、数据预处理

考虑到在CNN中会使用softmax，因此先将自变量原始数据转换为[0,1]之间，并将因变量转换为哑变量。

from keras.utils import np_utils

# 对自变量的处理
X_train = X_train.astype('float32') / 255
X_test = X_test.astype('float32') / 255

# 对因变量的处理
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)

三、模型的建立与编译

接下来建立基于Keras的CNN模型

model = Sequential()

# 两次卷积并用到最大池化
model.add(Conv2D(32, (3, 3), padding = 'same',
                 input_shape = X_train.shape[1:])) # 第一层需要指定数据格式
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))

# 同样两次卷积并用最大池化
model.add(Conv2D(64, (3, 3), padding = 'same'))
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))

# 将数据展平
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(10))
model.add(Activation('softmax'))

为了避免出现Curse of dimensionality，使用dropout。

通过model.summary()查看参数。

model.summary()

在这里插入图片描述

最后可以看到，有125w左右的参数。

建立完模型，然后要对其编译。

opt = keras.optimizers.rmsprop(lr = 0.0001, decay = 1e-6)
 
model.compile(loss = 'categorical_crossentropy',
              optimizer = opt,
              metrics = ['accuracy'])

由于本质还是分类问题，同样选择categorical_crossentropy作为损失函数。

这里对优化函数rmsprop人工设定了0.0001的学习率。

四、模型的训练与预测

接下来就是训练模型了。

hist = model.fit(X_train, y_train,
              batch_size = 32,
              epochs = 100,
              shuffle = True)

设定100个epoch，并随机打乱顺序。

由于参数比较多，训练还是需要花一定的时间的。
在这里插入图片描述
可以看到，完成100次迭代后，准确率达到了0.7922。

最后对测试集进行预测。

model.evaluate(X_test, y_test)

在这里插入图片描述
准确率有76.57%左右。

测试集的准确率相比对于训练集的准确率有所下降，说明模型还是存在过拟合的现象。

同时对测试集的准确率还没有超过80%，说明在模型的建立上还是可以再添加卷积层等，使模型更为复杂。

在这里插入图片描述

Artoria____

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录