一、导入数据
首先先导入CIFAR10数据集
from keras.datasets import cifar10
(X_train, y_train), (X_test, y_test) = cifar10.load_data()
print('图像数据格式:', X_train.shape)
print("训练集:%2.0f,测试集:%2.0f" %(X_train.shape[0], X_test.shape[0]))
可以看到,训练集有5w个样本,测试集有1w个样本。
且图片格式是32*32的。
由于是彩色图片,所以还会有3个通道(RGB)。
二、数据预处理
考虑到在CNN中会使用softmax,因此先将自变量原始数据转换为[0,1]之间,并将因变量转换为哑变量。
from keras.utils import np_utils
# 对自变量的处理
X_train = X_train.astype('float32') / 255
X_test = X_test.astype('float32') / 255
# 对因变量的处理
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
三、模型的建立与编译
接下来建立基于Keras的CNN模型
model = Sequential()
# 两次卷积并用到最大池化
model.add(Conv2D(32, (3, 3), padding = 'same',
input_shape = X_train.shape[1:])) # 第一层需要指定数据格式
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))
# 同样两次卷积并用最大池化
model.add(Conv2D(64, (3, 3), padding = 'same'))
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.25))
# 将数据展平
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(10))
model.add(Activation('softmax'))
为了避免出现Curse of dimensionality,使用dropout。
通过model.summary()
查看参数。
model.summary()
最后可以看到,有125w左右的参数。
建立完模型,然后要对其编译。
opt = keras.optimizers.rmsprop(lr = 0.0001, decay = 1e-6)
model.compile(loss = 'categorical_crossentropy',
optimizer = opt,
metrics = ['accuracy'])
由于本质还是分类问题,同样选择categorical_crossentropy作为损失函数。
这里对优化函数rmsprop人工设定了0.0001的学习率。
四、模型的训练与预测
接下来就是训练模型了。
hist = model.fit(X_train, y_train,
batch_size = 32,
epochs = 100,
shuffle = True)
设定100个epoch,并随机打乱顺序。
由于参数比较多,训练还是需要花一定的时间的。
可以看到,完成100次迭代后,准确率达到了0.7922。
最后对测试集进行预测。
model.evaluate(X_test, y_test)
准确率有76.57%左右。
测试集的准确率相比对于训练集的准确率有所下降,说明模型还是存在过拟合的现象。
同时对测试集的准确率还没有超过80%,说明在模型的建立上还是可以再添加卷积层等,使模型更为复杂。