利用keras实现MNIST手写数字识别
实验环境:anaconda3、python3.6.5、tensorflow1.10.3、keras2.2.4。(非GPU)
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense,Dropout
from keras.optimizers import RMSprop
(x_train,y_train),(x_test,y_test) = mnist.load_data() #导入数据,x代表输入的数据,y代表对应的标签
#准备图像数据(清洗数据)
#之前的图像保存在unit8类型的数组中,其形状为(60000,28,28),取值区间为【0,255】,我们需要将其变化成一个float数组,
#其形状为(60000,28*28),取值范围为【0,1】。查看原数据类型可用x_train/x_train.shape
x_train = x_train.reshape(60000,28*28)
x_train = x_train.astype('float32')/255
x_test = x_test.reshape(10000,28*28)
x_test = x_test.astype('float32')/255
#对标签进行分类编码
y_train = keras.utils.to_categorical(y_train)
y_test = keras.utils.to_categorical(y_test)
#利用Sequential定义的两层模型
model = Sequential()
model.add(Dense(512,activation='relu',input_shape=(28*28,)))#我们向第一层传入了输入数据的预期形状,这是一个只接受28*28维,
# 并且返回的是一个512维的向量,因为后面一层只能接受512维的向量输入。
#model.add(Dropout(0.5)) #防止过拟合,加入Dropout层,该层只在训练的时候有效
model.add(Dense(10,activation='softmax'))#这是一个10路softmax层,它将返回一个由10个概论值(总合为1)组成的数组。
# 每个概率值表示当前数字图像属于10个数字类别中的某一个的概论。本层没有input_shape(),因为keras中可以自动推导出输入形状等于上一层
#model.summary()
#编译(配置学习过程),指定模型使用的优化器和损失函数,以及训练过程中想要监控的指标
model.compile(loss='categorical_crossentropy',#mse
optimizer=RMSprop(lr=0.001),
metrics=['accuracy'])
#开始训练网络,通过fit()方法将输入数据的Numpy数据(和对应的目标数据)传入模型---迭代
model.fit(x_train,y_train,
batch_size=512,
epochs=5,)
#测试集上的结果
test_loss,test_acc = model.evaluate(x_test,y_test)
print('Test Acc:',test_acc)
本代码参考《python深度学习实战》