detach的简易用法

最新推荐文章于 2024-05-22 09:50:05 发布

文鸿wow

最新推荐文章于 2024-05-22 09:50:05 发布

阅读量2.7k

点赞数 2

分类专栏： python

本文链接：https://blog.csdn.net/qq_34430032/article/details/108106649

版权

python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

import torch 
a = torch.tensor([1, 2, 3.], requires_grad=True)
b = torch.tensor([2, 3, 4.], requires_grad=True)
n = a*2
n2 = n.detach()
f = n2 + 3*a/b
#detach 用法 阻断梯度传播 比如此时n2就没有梯度 但是a有 如果把对应a改成b 则b也有
f.sum().backward()
print(a.grad)


对于经常出现的round函数 本身没有梯度 可以采用
w_1 = round(w)-w
w_2 = w_1.detach()
w_3 = w_2 + w
这种方式 绕过对round求梯度 采取用w的梯度代替


代码运行结果：
tensor([3., 3., 3.])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

文鸿wow

关注关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
detach的简易用法

import torch a = torch.tensor([1, 2, 3.], requires_grad=True)b = torch.tensor([2, 3, 4.], requires_grad=True)n = a*2n2 = n.detach()f = n2 + 3*a/b#detach 用法阻断梯度传播比如此时n2就没有梯度但是a有如果把对应a改成b 则b也有f.sum().backward()print(a.grad)对于经常出现的round函数本身没有.
复制链接

扫一扫