pytorch如何计算导数_从零开始深度学习Pytorch笔记（8）—— 计算图与自动求导（上）...

最新推荐文章于 2023-08-03 01:12:52 发布

weixin_39907596

最新推荐文章于 2023-08-03 01:12:52 发布

阅读量151

点赞数

文章标签： pytorch如何计算导数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39907596/article/details/111859522

版权

首先我们定义一个张量x，并初始化赋值。注意的地方时，我们加入了requires_grad=True这个参数，该参数使得x张量可以被求导操作。

importtorch

x = torch.ones( 2, 3,requires_grad= True)

print(x)

然后我们通过x生成张量y。

y = x + 1

print(y)

我们检查张量y，发现张量y可以求导。

y.requires_grad

我们来完整构建一个计算图(按照之前的计算图)。

x = torch.tensor([[ 1., 2., 3.],[ 4., 5., 6.]],

requires_grad= True)

y = x+ 1

z = 2*y

m = torch.mean(z)

然后我们m进行求导。

m.backward

然后看看m对x求导的结果，通过复合求导我们可以算出，m对x的导数为1/3的x，因为x是全1张量：

x.grad # m对x求导结果结果为：1/3

发现计算结果和代码运行结果一致！

如果我们使用中间变量z求导，如下所示。

z.backward

结果会有异常，这是因为默认情况下，求导的操作只能是标量对标量求导，或者是标量对向量/矩阵求导！

其实，也可以使用非标量(向量/矩阵)对其他张量求导，只需要研究backward的方法参数即可，但是一般的神经网络误差反传场景下，我们的误差通常是个标量，所以掌握标量的求导已经够用啦~还有一点比较重要的是，一个计算图默认情况下只能backward一次。

m.backward #当我们尝试再次使用backward

仔细看抛出的异常：

RuntimeError:Trying to backward through the graph a second time, but the buffers have already been freed. Specify retain_graph=True when calling backward the first time.

大概意思是：你第二次再backward的时候，计算图已经销毁了，如果需要多次backward，你需要在第一次backward的时候，加上retain_graph=True的参数。

所以反向求导会让计算图销毁，主要是为了节约内存，你想想，我们的深度学习网络这么复杂，训练时要在网络中不断正向和反向传播，会计算n多次求导，是不是会很占用内存呢？

我们尝试重新建立计算图！

x = torch.tensor([[ 1., 2., 3.],[ 4., 5., 6.]],

requires_grad= True)

y = x+ 1

z = 2*y

m = torch.mean(z)

m.backward(retain_graph= True)

m.backward

这样在第二次backward求导就不会出问题啦~

weixin_39907596

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。