Python深度学习之Keras回调函数与TensorBoard

最新推荐文章于 2022-03-18 20:16:17 发布

CDFMLR

最新推荐文章于 2022-03-18 20:16:17 发布

阅读量744

点赞数 2

分类专栏： Python深度学习文章标签： python 深度学习可视化神经网络

本文链接：https://blog.csdn.net/u012419550/article/details/108072533

版权

本文介绍了如何使用Keras回调函数和TensorBoard来监控深度学习模型。Keras回调如ModelCheckpoint、EarlyStopping和LearningRateScheduler在训练过程中提供了灵活性，如自动保存最佳模型、提前终止训练和动态调整学习率。同时，TensorBoard作为TensorFlow的可视化工具，允许用户在训练过程中监控指标、模型架构和激活值等，以便更好地理解和优化模型。

摘要由CSDN通过智能技术生成

Deep Learning with Python

这篇文章是我学习《Deep Learning with Python》(第二版，François Chollet 著) 时写的系列笔记之一。文章的内容是从 Jupyter notebooks 转成 Markdown 的，你可以去 GitHub 或 Gitee 找到原始的 .ipynb 笔记本。

你可以去这个网站在线阅读这本书的正版原文(英文)。这本书的作者也给出了配套的 Jupyter notebooks。

本文为 第7章高级的深度学习最佳实践 (Chapter 7. Advanced deep-learning best practices) 的笔记之一。

文章目录

Deep Learning with Python
- 7.2 Inspecting and monitoring deep-learning models using Keras callbacks and TensorBoard

7.2 Inspecting and monitoring deep-learning models using Keras callbacks and TensorBoard

使用 Keras 回调函数和 TensorBoard 来检查并监控深度学习模型

用 model.fit() 开启一个复杂的训练任务后，我们就只能干等着，在结束前都不知道它有没有正确工作，也无法控制它，好似抛出了一架纸飞机，任它随风去往不确定的远方。比起这样不受控制的纸飞机，或许我们更希望要一台智能的无人机，可以感知环境，将数据发回给我们，并基于当前状态自主航行。 Keras 的回调函数与 TensorBoard 这样的工具就可以帮我们把“纸飞机”改造成“智能的无人机”。

训练中将回调函数作用于模型

我们在训练模型的时候，一开始是不知道要跑多少轮的，我们只能让它跑足够多的轮次，然后手动找出一个最佳的轮次数，重新用这个最佳轮次数去训练模型，这样相当耗时。所以，我们更希望当模型观测到验证损失不再改善时就自动停止训练。

这种操作就可以用 Keras 回调函数（callback）完成：Keras 提供了很多有用的 callback，放在 keras.callbacks 里，自动停止训练只是其中一种用法。

Callback 会在训练过程中的不同时间点被模型调用，它可以访问模型的状态，并可以采取一些行动，例如：

模型检查点：在训练过程中的不同时间点保存模型的当前权重
提前终止：验证损失不再改善时中断训练
动态调节参数值：例如动态调整优化器的学习率
记录训练指标和验证指标：用这些指标就可以将模型学到的表示可视化
…

使用 callback

Keras 内置了许多有用的 callback，例如：

ModelCheckpoint：在训练过程中保存训练到某些状态的模型。可以用来持续不断地保存模型，也可以选择性地保存目前的最佳模型；
EarlyStopping：监控的目标指标，如果在设定的轮数内不再改善，则中断训练；
ReduceLROnPlateau：在验证损失不再改善时（遇到loss plateau），降低学习率。

这些 callback 的使用也很简单：

from tensorflow import keras

callbacks_list = [
    # 在每轮完成后保存权重
    keras.callbacks.ModelCheckpoint(
        filepath='my_model.h5',  # 保存文件的路径
        monitor='val_loss',      # monitor：要验证的指标
        save_best_only=True,     # 只保存让 monitor 指标最好的模型（如果 monitor 没有改善，就不保存）
    ),
    # 不再改善时中断训练
    keras.callbacks.EarlyStopping(
        monitor='acc',           # 要验证的指标
        patience=10,             # 如果 monitor 在多于 patience 轮内（比如这里就是10+1=11轮）没有改善，则中断训练
    ),
    # 不再改善时降低学习率
    keras.callbacks.ReduceLROnPlateau(
        monitor='val_loss',    # 要验证的指标
        factor=0.1,            # 触发时：学习率 *= factor
        patience=5,            # monitor 在 patience 轮内没有改善，则触发降低学习率
    ),
]

model.compile(optimizer='rmsprop', 
              loss='binary_crossentropy', 
              metrics=['acc'])    # 在 callback 里用到了 acc 做指标，所以这里的 metrics 里要有 acc

model.fit(x, y, 
          epochs=10, 
          batch_size=