梯度爆炸,tensorboard可视化,变量作用域---My way of ML14

本文探讨了梯度爆炸问题及其解决方案,包括调整网络结构、学习率和使用梯度截断。同时,介绍了TensorBoard的数据序列化和可视化方法,通过变量作用域使代码更清晰,并提供了如何定义变量作用域的示例。
摘要由CSDN通过智能技术生成

梯度爆炸

在极端的情况下,不合适的学习率,会导致权重的值变得非常大,以至于溢出导致Nan

如何解决
  1. 重新设计网络(对于神经网络而言)
  2. 调整学习率
  3. 使用梯度截断(在训练过程中检查和限制梯度的大小)
  4. 使用激活函数

可视化

数据序列化–event文件

API:tf.summary.FileWirte(路径,graph=sses.graph)

开启:tensorboard --logdir=“路径”

案例在说话变量作用域一起说

变量作用域

变量作用域的目的就是让程序更加的一目了然,让可视化的图形更加简洁。

如何写变量作用域

ML13的代码为例。
其实就是在不同的模块上加上:

with tf.variable_scope(“作用域名字”):

在这里插入图片描述

我们先看没有模块化之前的图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值