pytorch梯度裁剪（Clipping Gradient）：torch.nn.utils.clip_grad_norm

最新推荐文章于 2025-03-29 23:50:47 发布

Arthur-Ji

最新推荐文章于 2025-03-29 23:50:47 发布

阅读量3.6k

点赞数 1

分类专栏： pytorch 文章标签： pytorch 深度学习 python

原文链接：https://www.cnblogs.com/lindaxin/p/7998196.html

版权

pytorch 专栏收录该内容

54 篇文章

订阅专栏

1	`torch.nn.utils.clip_grad_norm(parameters, max_norm, norm_type=2)`

1、梯度裁剪原理（http://blog.csdn.net/qq_29340857/article/details/70574528）

既然在BP过程中会产生梯度消失/爆炸（就是偏导无限接近0，导致长时记忆无法更新），那么最简单粗暴的方法，设定阈值，当梯度小于/大于阈值时，更新的梯度为阈值，如下图所示：
这里写图片描述

优点：简单粗暴
缺点：很难找到满意的阈值

2、nn.utils.clip_grad_norm(parameters, max_norm, norm_type=2)

这个函数是根据参数的范数来衡量的

Parameters:

- parameters (Iterable[Variable]) – 一个基于变量的迭代器，会进行归一化（原文：an iterable of Variables that will have gradients normalized）
- max_norm (float or int) – 梯度的最大范数（原文：max norm of the gradients）
- norm_type(float or int) – 规定范数的类型，默认为L2（原文：type of the used p-norm. Can be'inf'for infinity norm）

Returns:参数的总体范数（作为单个向量来看）（原文：Total norm of the parameters (viewed as a single vector).）

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。