一个例子
小编在GitHub上找到了一个基于卷积神经网络(CNN)的验证码识别项目,将关键的代码进行整理,去掉了无助于理解过程的代码。keras编程的过程可划分为六个阶段:数据预处理 → \rightarrow →定义神经网络结构 → \rightarrow →编译模型 → \rightarrow →训练网络 → \rightarrow →使用模型进行预测 → \rightarrow →进行数据后处理。
'''为了凸显keras编程的核心步骤,需要导入的库以及路径的定义不再列出'''
# 数据预处理--the 1st core step
# 将数据从本地文件加载到内存中,并进行格式化处理
data, label = load_data(pic_folder)
data_train, data_test, label_train, label_test = \
train_test_split(data, label, test_size=0.1, random_state=0)
# 定义神经网络结构--the 2nd core step
# keras是模块化的添加层结构
inputs = layers.Input((40, 40, 3))
x = layers.Conv2D(32, 9, activation='relu')(inputs)
x = layers.Conv2D(32, 9, activation='relu')(x)
x = layers.MaxPool2D((2, 2))(x)
x = layers.Dropout(0.25)(x)
x = layers.Flatten()(x)
x = layers.Dense(640)(x)
x = layers.Dropout(0.5)(x)
out = layers.Dense(len(APPEARED_LETTERS), activation='softmax')(x)
model = Model(inputs=inputs, outputs=out)
# 编译模型--the 3rd core step
# 配置损失函数、优化目标等
model.compile(
optimizer='adadelta',
loss=['categorical_crossentropy'],
metrics=['accuracy'],
)
# 训练神经网络--the 4th core step
# 开始训练神经网络,进行一些独立于网络结构之外的预处理,例如提前确认在计算的过程中对某些数据进行保存
his = model.fit(
x_train, y_train, batch_size=128, epochs=100,
validation_split=0.1, callbacks=[ModelCheckpoint(
os.path.join(weight_folder, '{epoch:02d}.hdf5'))],
)
# 基于模型的预测--the 5th core step
# 直接调用predict函数即可
model.load_weights(model_path)
data = get_testX()
out = model.predict(data)
# 数据后处理--the 6th core step
# 其实就是分析数据
# metrics数据结果
print(his.history)
# 可视化结果
tb_cb = keras.callbacks.TensorBoard(log_dir=log_filepath, write_images=1, histogram_freq=1)
cbks = [tb_cb] # cbks作为一个回调函数在执行fit函数时调用
六个阶段可以总结为两个部分
所有的六个阶段放在一起又可以分成两个大的部分,一个是模型的训练,包含前四个阶段,另一个是模型的应用,包含后两个阶段。
模型训练
我们建立的神经网络就是一个封闭的自循环的计算系统,如图1所示。图中的上下两部分分别对应着前向传播和反向传播:在进行前向传播的过程中,我们需要定义神经网络的结构,也就是第二个阶段要完成的任务;在进行反向传播的过程中,我们需要定义损失函数、优化目标等信息,也就是第三个阶段要完成的任务。相比于二三阶段,第一和第四阶段就显得不那么重要了,但也是必不可少的。在第一阶段我们要将数据转化成神经网络可识别的格式,在第四阶段,我们开始这个计算过程。
在这一部分我们使用已经训练好的神经网络对测试数据进行预测,并通常使用一定的可视化手段对获得的数据进行预测,比如将loss的变化过程打印出来看看神经网络收敛的效果如何,看看多测试集上正确率的分位数等 等,如图所示。
我们在文章中给出的代码一般都是不能运行的,这么做只是为了更加地清晰对问题进行描述,还请见谅,我们会将可以运行的源代码放在GitHub上,以供参考。
GitHub地址:https://github.com/1173710224/keras-cnn-captcha
欢迎关注公众号BBIT
让我们共同学习共同进步!