Pytorch 叶子节点和非叶子节点的理解

1.为什么要区分叶子节点和非叶子节点?

为了节省内存。在pytorch的计算图里只有两种元素:数据(tensor)和 运算(operation)。其中数据可分为:叶子节点(leaf node)和非叶子节点;叶子节点是用户创建的节点,不依赖其它节点;它们表现出来的区别在于反向传播结束之后,非叶子节点的梯度会被释放掉,只保留叶子节点的梯度,这样就节省了内存。

PS:注意这里的描述“非叶子节点的梯度会被释放掉”。这其实暗含了非叶子节点必须是要参与梯度计算的,也就是requires_grad=True,同时也意味着requires_grad=False的节点一定是叶子节点,因为这样的tensor压根不参与求导,也没梯度,自然不需要“释放掉梯度”。这就成为了判别叶子节点和非叶子节点的第一个标准,见下。

2.如何区分叶子节点和非叶子节点?

判断一个节点是否是叶子节点,只需满足以下条件之一:

A.所有requires_grad为False的张量(Tensor) 都为叶子节点( leaf Tensor)

B.requires_grad为True的张量(Tensor),如果他们是由用户创建的,则它们是叶张量(leaf Tensor)。这意味着它们不是运算的结果,因此grad_fn为None。

>>> a = torch.rand(10, requires_grad=True)
>>> a.is_leaf
True
#a was created by user
>>> b = torch.rand(10, requires_grad=False)
>>> b.is_leaf
True
>>> c = torch.rand(10, requires_grad=True) + 2
>>> c.is_leaf
False
# c was created by the addition operation

PS:神经网络层中的权值w的tensor均为叶子节点

 

参考:http://t.csdnimg.cn/xbCXP 

http://t.csdnimg.cn/NdJ7P 

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值