基于CNN的CIFAR10实例

一、导入数据

首先先导入CIFAR10数据集

from keras.datasets import cifar10

(X_train, y_train), (X_test, y_test) = cifar10.load_data()

print('图像数据格式:', X_train.shape)
print("训练集:%2.0f,测试集:%2.0f" %(X_train.shape[0], X_test.shape[0]))

在这里插入图片描述

可以看到,训练集有5w个样本,测试集有1w个样本。
且图片格式是32*32的。

由于是彩色图片,所以还会有3个通道(RGB)。

二、数据预处理

考虑到在CNN中会使用softmax,因此先将自变量原始数据转换为[0,1]之间,并将因变量转换为哑变量。

from keras.utils import np_utils

# 对自变量的处理
X_train = X_train.astype('float32') / 255
X_test = X_test.astype('float32') / 255

# 对因变量的处理
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)

三、模型的建立与编译

接下来建立基于Keras的CNN模型

model = Sequential()

# 两次卷积并用到最大池化
model.add(Conv2D(32, (3, 3), padding = 'same',
                 input_shape = X_train.shape[1:])) # 第一层需要指定数据格式
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))

# 同样两次卷积并用最大池化
model.add(Conv2D(64, (3, 3), padding = 'same'))
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))

# 将数据展平
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(10))
model.add(Activation('softmax'))

为了避免出现Curse of dimensionality,使用dropout。

通过model.summary()查看参数。

model.summary()

在这里插入图片描述

最后可以看到,有125w左右的参数。

建立完模型,然后要对其编译。

opt = keras.optimizers.rmsprop(lr = 0.0001, decay = 1e-6)
 
model.compile(loss = 'categorical_crossentropy',
              optimizer = opt,
              metrics = ['accuracy'])

由于本质还是分类问题,同样选择categorical_crossentropy作为损失函数。

这里对优化函数rmsprop人工设定了0.0001的学习率。

四、模型的训练与预测

接下来就是训练模型了。

hist = model.fit(X_train, y_train,
              batch_size = 32,
              epochs = 100,
              shuffle = True)

设定100个epoch,并随机打乱顺序。

由于参数比较多,训练还是需要花一定的时间的。
在这里插入图片描述
可以看到,完成100次迭代后,准确率达到了0.7922。

最后对测试集进行预测。

model.evaluate(X_test, y_test)

在这里插入图片描述
准确率有76.57%左右。

测试集的准确率相比对于训练集的准确率有所下降,说明模型还是存在过拟合的现象。

同时对测试集的准确率还没有超过80%,说明在模型的建立上还是可以再添加卷积层等,使模型更为复杂。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值