我们知道keras的模型一般保存为后缀名为h5的文件,比如final_model.h5。同样是h5文件用save()和save_weight()保存效果是不一样的。
我们以MNIST数据集为例来设计模型LeNet5验证。
1、设计模型(LeNet5)
def lenet5_mode(input_shape, classes):
model = Sequential()
#layer1
model.add(Conv2D(filters=20,kernel_size=(5,5), padding='same', input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
#layer2
model.add(Conv2D(filters=50, kernel_size=(5,5), padding='same'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
#layer3
model.add(Flatten())
model.add(Dense(500))
model.add(Activation('relu'))
# model.add(Dropout(0.5))
#layer4
model.add(Dense(classes))
model.add(Activation('softmax'))
return model
2、导入数据
def load_mnist_data():
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train.reshape(X_train.shape[0],28, 28, -1)
X_test = X_test.reshape(X_test.shape[0], 28, 28, -1)
X_train = X_train/255.0
X_test = X_test/255.0
y_train=np_utils.to_categorical(y_train,num_classes=10)
y_test=np_utils.to_categorical(y_test,num_classes=10)
return X_train, y_train, X_test, y_test
3、训练模型并保存
def main():
X_train, y_train, X_test, y_test = load_mnist_data()
input_shape = (28, 28, 1)
classes = 10
model = lenet5_mode(input_shape, classes)
model.save('model1.h5')
model.summary()
model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])
model.fit(X_train, y_train, batch_size=32, epochs=10, validation_data=(X_test, y_test))
model.save('model2.h5')
model.save_weights('model3.h5')
该函数中共保存了三个模型:model1.h5、model2.h5、model3.h5
通过命令:du -h *.h5 可以查看三个模型的大小
4、模型保存说明
model2.h5表示save()保存的模型结果,它既保持了模型的图结构,又保存了模型的参数,所以它的size最大的。
model1.h5表示save()保存的训练前的模型结果,它保存了模型的图结构,但应该没有保存模型的初始化参数,所以它的size要比model2.h5小很多。
model3.h5表示save_weights()保存的模型结果,它只保存了模型的参数,但并没有保存模型的图结构。所以它的size也要比model2.h5小很多。
即:save()保存模型权重参数和网络结构,save_weights()仅保存模型的权重参数。
5、模型加载预测
两种不同方法保存的模型文件也需要用不同的加载方法。
对于前者model1.h5和model2.h5,里面含有网络结构和权重参数,加载较为简单
from keras.models import load_model
model = load_model('model1.h5')
#mode2 = load_model('model2.h5')
model.summary() #该函数主要展示网络结构
对于后者model3.h5中不含有网络结构,因此稍微复杂点,需要构建响应的网络结构
input_shape = (28, 28, 1)
classes = 10
model = lenet5_mode(input_shape, classes)
model.load_weights('model3.h5')
model.summary()