最新版本: https://www. mashangxue123.com/tenso rflow/tf2-tutorials-keras-save_and_restore_models.html
英文版本: https:// tensorflow.google.cn/al pha/tutorials/keras/save_and_restore_models
翻译建议PR: https:// github.com/mashangxue/t ensorflow2-zh/edit/master/r2/tutorials/keras/save_and_restore_models.md
模型进度可以在训练期间和训练后保存。这意味着模型可以在它停止的地方继续,并避免长时间的训练。保存还意味着您可以共享您的模型,其他人可以重新创建您的工作。当发布研究模型和技术时,大多数机器学习实践者共享: 用于创建模型的代码 以及模型的训练权重或参数
共享此数据有助于其他人了解模型的工作原理,并使用新数据自行尝试。
注意:小心不受信任的代码(TensorFlow模型是代码)。有关详细信息,请参阅安全使用TensorFlow 。
选项
保存TensorFlow模型有多种方法,具体取决于你使用的API。本章节使用tf.keras(一个高级API,用于TensorFlow中构建和训练模型),有关其他方法,请参阅TensorFlow保存和还原指南或保存在eager中。
1. 设置
1.1. 安装和导入
需要安装和导入TensorFlow和依赖项
pip install h5py pyyaml
1.2. 获取样本数据集
我们将使用MNIST数据集来训练我们的模型以演示保存权重,要加速这些演示运行,请只使用前1000个样本数据:
from __future__ import absolute_import, division, print_function, unicode_literals
import os
!pip install tensorflow==2.0.0-alpha0
import tensorflow as tf
from tensorflow import keras
tf.__version__
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()
train_labels = train_labels[:1000]
test_labels = test_labels[:1000]
train_images = train_images[:1000].reshape(-1, 28 * 28) / 255.0
test_images = test_images[:1000].reshape(-1, 28 * 28) / 255.0
1.3. 定义模型
让我们构建一个简单的模型,我们将用它来演示保存和加载权重。
# 返回一个简短的序列模型
def create_model():
model = tf.keras.models.Sequential([
keras.layers.Dense(512, activation='relu', input_shape=(784,)),
keras.layers.Dropout(0.2),
keras.layers.Dense(10, activation='softmax')
])
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
return model
# 创建基本模型实例
model = create_model()
model.summary()
Model: "sequential"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
dense (Dense) (None, 512) 401920
________________________________________________________