pytorch 学习 |梯度截断 gradient clip 的简单实现

最新推荐文章于 2024-05-28 16:44:20 发布

qyhyzard

最新推荐文章于 2024-05-28 16:44:20 发布

阅读量2w

点赞数 4

分类专栏： pytorch DL

本文链接：https://blog.csdn.net/CVSvsvsvsvs/article/details/91137997

版权

在训练模型的过程中，我们有可能发生梯度爆炸的情况，这样会导致我们模型训练的失败。
我们可以采取一个简单的策略来避免梯度的爆炸，那就是梯度截断Clip, 将梯度约束在某一个区间之内，在训练的过程中，在优化器更新之前进行梯度截断操作。
整个流程简单总结如下：

加载训练数据和标签
模型输入输出
计算loss函数值
loss 反向传播
梯度截断
优化器更新梯度参数

pytorch 代码如下：

def clip_gradient(optimizer, grad_clip):
    """
    Clips gradients computed during backpropagation to avoid explosion of gradients.

    :param optimizer: optimizer with the gradients to be clipped
    :param grad_clip: clip value
    """
    for group in

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qyhyzard

关注关注

4
点赞
踩
39

收藏

觉得还不错? 一键收藏
1
评论
pytorch 学习 |梯度截断 gradient clip 的简单实现

在训练模型的过程中，我们有可能发生梯度爆炸的情况，这样会导致我们模型训练的失败。我们可以采取一个简单的策略来避免梯度的爆炸，那就是梯度截断Clip, 将梯度约束在某一个区间之内，在训练的过程中，在优化器更新之前进行梯度截断操作。整个流程简单总结如下：加载训练数据和标签模型输入输出计算loss函数值loss 反向传播梯度截断优化器更新梯度参数pytorch 代码如下：def ...
复制链接

扫一扫