TensorFlow中的梯度裁剪（Gradient Clipping）

最新推荐文章于 2022-05-23 13:47:57 发布

jetFlow

最新推荐文章于 2022-05-23 13:47:57 发布

阅读量1.2w

点赞数 3

分类专栏：深度学习 tensorflow 文章标签： tensorflow

本文链接：https://blog.csdn.net/jetFlow/article/details/80161354

版权

本文介绍了深度学习中解决梯度爆炸问题的TensorFlow函数，包括tf.clip_by_norm、tf.clip_by_global_norm、tf.clip_by_average_norm和tf.clip_by_value，通过实例解析了它们的工作原理和使用方法，确保优化过程的数值稳定性。

摘要由CSDN通过智能技术生成

梯度爆炸是深度学习中十分常见的现象，有时会导致寻优过程不收敛，或者算出来的结果干脆直接溢出，例如在Python里都是Nan，使迭代无法继续下去。TensorFlow里提供了一系列简单可行的梯度裁剪函数，方便我们对超过阈值的梯度值进行规约，使优化算法相对更加数值稳定。
TensorFlow里提供的几个Gradient Clipping函数都是以clip_by开头，分别是tf.clip_by_norm，tf.clip_by_global_norm，tf.clip_by_average_norm和tf.clip_by_value，下面依次逐个介绍。

1. tf.clip_by_norm

使用方法：

tf.clip_by_norm(t, clip_norm, axes=None, name=None)
"""
t: 要裁剪的梯度张量
clip_norm: 裁剪阈值，一个合适的正数
axes: 需要进行规约的维度，为None时，则对张量t的所有元素做规约
name:操作名称
"""

规约公式如下：

t={ t∗clip_norm||t||2 ,t ,||t||2≥clip_normotherwise t = { t ∗ c l i p _ n o r m | | t | | 2   , | | t | | 2 ≥ c l i p _ n o r m t   , otherwise

$t = \begin{cases} t * \frac{clip\_norm}{||t||_2}\ , & ||t||_2 \geq clip\_norm \\ t\ , & \text{otherwise} \end{cases}$

其中： ||t|

最低0.47元/天解锁文章

jetFlow

关注

3
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录