那些张量不能使用内置操作？很显然是叶子张量，还有就是一部分的中间张量。

君子于役无缘对面

于 2022-11-01 17:10:01 发布

阅读量119

点赞数

文章标签：深度学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gjt16178/article/details/127637078

版权

参考了以下内容：
pytorch中inplace以及detach()操作对求梯度过程(backward)的影响 - 知乎 (zhihu.com)

并进行了简单的总结：

A. detach会分离计算图，但共享内存。即使强行设requires_grad=True,它没有计算图，反向传播也传不回去。就是backward会断开。

B. 不能用in-place的两种情况:

a.对于要求梯度的叶子张量不能

b.对于在求梯度阶段需要用到的张量不能（如下例所示）

C.非内置操作只会改变该处的值，但内置操作会同时改变最终的梯度，以及计算图。 .data的内置操作会改变值，以及梯度，不会改变计算图。

对于B这点进行详细说明，其他可以去参考原文。

首先叶子张量是我们要反向传播优化的，肯定是需要其原值的，以及其梯度，内置操作会改变其原值，就没办法就是优化了。

对于一部分的非叶子张量，也是不可以内置操作的，下面举出一个简单的例子，帮助理解。*=是一个内置操作。（导入模块： import torch）

会报错，因为内置操作那一步的梯度是2f，但是f的值因为内置操作会改变，而求的梯度是会用到f这个变量原先存储的值的。所以报错。

而变成下面这样，就不会出错了，正常反向传播。因为此时梯度是6，与f的值无关。

君子于役无缘对面

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
那些张量不能使用内置操作？很显然是叶子张量，还有就是一部分的中间张量。

那些张量不能使用内置操作？很显然是叶子张量，还有就是一部分的中间张量。
复制链接

扫一扫

君子于役无缘对面 CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

82万+: 周排名

18万+: 总排名

2615: 访问

: 等级

79: 积分

2: 粉丝

6: 获赞

4: 评论

7: 收藏

私信

关注

热门文章

最新评论

问题：yolox里计算gt框的和预测框的iou值，其中使用torch.prod算框交集会出现inf，导致simota的结果会出现nan值。
CSDN-Ada助手: 恭喜您写了第6篇博客！关于计算gt框和预测框的iou值遇到的问题，非常感谢您分享这个挑战。对于使用torch.prod算框交集导致inf的情况，确实是一个有趣的问题。希望您能继续深入研究，探索解决方案，并分享给大家。或许可以尝试其他方法来计算框交集，避免出现inf和导致simota结果出现nan值的问题。期待您的下一篇博客，继续分享您的研究成果和心得！谢谢您的分享！
C++多态的两种体现：重写（覆盖）和重载。以及重定义的区别
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题中提到的C++多态的两种体现：重写（覆盖）和重载，以及重定义的区别，让我对这些概念有了更清晰的理解。您的文章非常易懂，对于初学者来说是一份很好的指南。继续创作下去，我建议您可以深入探讨一些实际应用场景，例如在软件开发中如何灵活运用多态的概念。或者您可以分享一些实际案例，让读者更好地理解多态的重要性和实际效果。无论您选择哪个方向，我相信您的文章将会给读者带来更多的启发和帮助。再次感谢您的分享，期待您的下一篇博客！
列表作为参数传入一个函数
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。