.detach() . + detach_() 解析

Pengsen Ma

已于 2024-03-20 10:40:27 修改

阅读量1.7w

点赞数 3

分类专栏： Pytorch相关文章标签： pytorch 人工智能 python

于 2021-06-08 10:40:23 首次发布

本文链接：https://blog.csdn.net/weixin_43135178/article/details/117691683

版权

Pytorch相关专栏收录该内容

62 篇文章

订阅专栏

这篇博客介绍了PyTorch中detach()和detach_()函数的用途，它们用于在神经网络训练时阻止部分参数的更新。detach()返回一个新的Variable，不参与反向传播，而detach_()直接在原Variable上操作，切断其在计算图中的联系，两者都会设置requires_grad为False。理解这两个函数对于精细化网络训练和控制梯度传播至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

当我们再训练网络的时候可能

希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；
或者只训练部分分支网络，并不让其梯度对主网络的梯度造成影响，

这时候我们就需要使用detach()函数来切断一些分支的反向传播

1. detach()

返回一个新的Variable，从当前计算图中分离下来的，但是仍指向原变量的存放位置,不同之处只是requires_grad为false，得到的这个Variable永远不需要计算其梯度，不具有grad。即使之后重新将它的requires_grad置为true,它也不会具有梯度grad

例子：

此时的模型输入传递关系为：A-->B

反向传播避免某个模型A参数的更新：

# 得到A模型的输出a
a = A(input)
# 将模型A的输出a从当前计算图中分离下来的, 使grad为False
a = detach()

# 得到B模型的输出b
b = B(a)

# 由于A已经被从计算图中分离了，所以这里只更新B的参数
loss = criterion(b, target)
loss.backward()

反向传播避免某个模型B参数的更新：

# 将B的所有grad为False
for param in B.parameters():
	param.requires_grad = False

a = A(input)
b = B(a)
# 只更新A的参数
loss = criterion(b, target)
loss.backward()