找了好几篇觉得都写得或者说翻译得不能让我很好地理解,所以自己找来官方文档翻译并记录了一下,以便以后自己查阅
说明:该API在v1、v2的Tensoflow中用法一致
接下来进入正文。
- 作用:简单来说,就是利用梯度裁剪的方式避免梯度爆炸,“梯度爆炸”自己可查阅相关资料理解。
- 原型
tf.clip_by_global_norm(
t_list,
clip_norm,
use_norm=None,
name=None
)
给定张量t_list的元组或列表以及裁剪率clip_norm,此操作将返回裁剪后的list_clipped的张量列表以及t_list中所有张量的全局范数(global_norm)。 或者,如果您已经为t_list计算了全局范数,则可以使用use_norm指定全局范数。
- 参数说明:
t_list
:梯度张量,tuple或者mixed tensor、IndexedSlices或None的列表。clip_norm
: 标量,表示梯度裁剪的比例因子,在裁剪中,裁剪之后的梯度符合如下公式:
t _ l i s t [ i ] = t _ l i s t [ i ] ∗ c l i p _ n o r m m a x ( g l