pytorch .detach() .detach_() 和 .data用于切断反向传播的实现

Wanderer001

已于 2023-11-02 20:12:05 修改

阅读量1.2k

点赞数 1

分类专栏： Pytorch 文章标签：计算机视觉深度学习机器学习

于 2022-04-26 08:43:20 首次发布

本文链接：https://blog.csdn.net/weixin_36670529/article/details/107244339

版权

参考 pytorch .detach() .detach_() 和 .data用于切断反向传播的实现 - 云+社区 - 腾讯云

这篇文章主要介绍了pytorch .detach() .detach_() 和 .data用于切断反向传播的实现。

当我们再训练网络的时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；或者只训练部分分支网络，并不让其梯度对主网络的梯度造成影响，这时候我们就需要使用detach()函数来切断一些分支的反向传播。

1、detach()

返回一个新的Variable，从当前计算图中分离下来的，但是仍指向原变量的存放位置,不同之处只是requires_grad为false，得到的这个Variable永远不需要计算其梯度，不具有grad。即使之后重新将它的requires_grad置为true,它也不会具有梯度grad。这样我们就会继续使用这个新的Variable进行计算，后面当我们进行反向传播时，到该调用detach()的Variable就会停止，不能再继续向前进行传播。

源码为：

def detach(self):

    """Returns a new Variable, detached from the current graph.

    Result will never require gradient. If the input is volatile, the output

    will be volatile too.

    .. note::

     Returned Variable uses the same data tensor, as the original one, and

     in-place modifications on either of them will be seen, and may trigger

     errors in correctness checks.

    """

    result = NoGrad()(self) # this is needed, because it merges version counters

    result._grad_fn = None

　　　　 return result

可见函数进行的操作有：

将grad_fn设置为None
将Variable的requires_grad设置为False

如果输入 volatile=True(即不需要保存记录，当只需要结果而不需要更新参数时这么设置来加快运算速度)，那么返回的V

最低0.47元/天解锁文章

Wanderer001

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
pytorch .detach() .detach_() 和 .data用于切断反向传播的实现

这篇文章主要介绍了pytorch .detach() .detach_() 和 .data用于切断反向传播的实现。当我们再训练网络的时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；或者只训练部分分支网络，并不让其梯度对主网络的梯度造成影响，这时候我们就需要使用detach()函数来切断一些分支的反向传播。1、detach()返回一个新的Variable，从当前计算图中分离下来的，但是仍指向原变量的存放位置,不同之处只是requires_grad为false，得到的这个Vari
复制链接

扫一扫