tensorflow 保存训练loss_tensorflow2.0保存和加载模型 (tensorflow2.0官方教程翻译)

最新推荐文章于 2022-08-08 15:23:12 发布

盈超农化

最新推荐文章于 2022-08-08 15:23:12 发布

阅读量904

点赞数 1

文章标签： tensorflow 保存训练loss

本文链接：https://blog.csdn.net/weixin_29502425/article/details/113628327

版权

本文介绍了在TensorFlow 2.0中如何在训练期间保存检查点，手动保存权重，以及保存整个模型。通过示例展示了如何使用tf.keras在训练过程中自动保存模型状态，便于中断后继续训练，同时也讲解了如何从检查点或HDF5文件恢复模型。此外，文章提到了保存模型的其他方法，如SavedModel格式，以及安全使用TensorFlow的注意事项。

摘要由CSDN通过智能技术生成

最新版本： https://www. mashangxue123.com/tenso rflow/tf2-tutorials-keras-save_and_restore_models.html
英文版本： https:// tensorflow.google.cn/al pha/tutorials/keras/save_and_restore_models
翻译建议PR： https:// github.com/mashangxue/t ensorflow2-zh/edit/master/r2/tutorials/keras/save_and_restore_models.md

模型进度可以在训练期间和训练后保存。这意味着模型可以在它停止的地方继续，并避免长时间的训练。保存还意味着您可以共享您的模型，其他人可以重新创建您的工作。当发布研究模型和技术时，大多数机器学习实践者共享: 用于创建模型的代码 以及模型的训练权重或参数

共享此数据有助于其他人了解模型的工作原理，并使用新数据自行尝试。

注意：小心不受信任的代码(TensorFlow模型是代码)。有关详细信息，请参阅安全使用TensorFlow 。

选项

保存TensorFlow模型有多种方法，具体取决于你使用的API。本章节使用tf.keras(一个高级API，用于TensorFlow中构建和训练模型)，有关其他方法，请参阅TensorFlow保存和还原指南或保存在eager中。

1. 设置

1.1. 安装和导入

需要安装和导入TensorFlow和依赖项

pip install h5py pyyaml

1.2. 获取样本数据集

我们将使用MNIST数据集来训练我们的模型以演示保存权重，要加速这些演示运行，请只使用前1000个样本数据：

from __future__ import absolute_import, division, print_function, unicode_literals

import os

!pip install tensorflow==2.0.0-alpha0
import tensorflow as tf
from tensorflow import keras

tf.__version__
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

train_labels = train_labels[:1000]
test_labels = test_labels[:1000]

train_images = train_images[:1000].reshape(-1, 28 * 28) / 255.0
test_images = test_images[:1000].reshape(-1, 28 * 28) / 255.0

1.3. 定义模型

让我们构建一个简单的模型，我们将用它来演示保存和加载权重。

# 返回一个简短的序列模型 
def create_model():
  model = tf.keras.models.Sequential([
    keras.layers.Dense(512, activation='relu', input_shape=(784,)),
    keras.layers.Dropout(0.2),
    keras.layers.Dense(10, activation='softmax')
  ])

  model.compile(optimizer='adam',
                loss='sparse_categorical_crossentropy',
                metrics=['accuracy'])

  return model


# 创建基本模型实例
model = create_model()
model.summary()
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense (Dense)                (None, 512)               401920    
________________________________________________________