求导（前向求导和反向求导）

m0_67708072

已于 2024-05-11 07:29:02 修改

阅读量1.3k

点赞数 45

分类专栏： pytorch python基础文章标签： pytorch 神经网络深度学习

于 2024-05-11 07:24:34 首次发布

本文链接：https://blog.csdn.net/m0_67708072/article/details/138694096

版权

pytorch python基础专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前向求导与反向求导

前向求导：一个输入对所有结点的影响
反向求导：所有结点对一个输出的影响

前向求导

$y_1=2x_1+x_2\\ y_2 = 3x_3\\ z=2y_1+y_2$
在这里插入图片描述
1 前向求导求z对x1的导数

2 前向求导求z对x2的导数

上述两次前向求导才能求得z对x1，x2的导数，若希望一次求得z对x1，x2的导数，需要反向求导。

反向求导

从z开始反向求导（所有结点对一个输出的影响）：

总结

多次前向求导才能求得z对x1,x2,x3的导数；一次反向求导即可求得z对x1,x2,x3的导数

求导实现

上面手工求得z对x1,x2,x3的导数：4，2，3

x1 = torch.tensor([1.0,2.0,3.0], requires_grad=True)
x2 = torch.tensor([1.0,2.0,3.0], requires_grad=True)
x3 = torch.tensor([1.0,2.0,3.0], requires_grad=True)
y1=2*x1+x2
y2=3*x3
z=2*y1+y2

由于输入的x1,x2,x3不是标量，不是一个数，是向量，所以可以按如下2种方式求导。
求导方式1：

 # 输入x1等 是3维向量，所以输出z是3维向量->因此需要给一个初始梯度
z.backward(torch.tensor([1.0,1.0,1.0])) 
x1.grad, x2.grad, x3.grad

(tensor([4., 4., 4.]), tensor([2., 2., 2.]), tensor([3., 3., 3.]))

求导方式2：

z.sum().backward()
x1.grad,x2.grad,x3.grad

(tensor([4., 4., 4.]), tensor([2., 2., 2.]), tensor([3., 3., 3.]))

m0_67708072

关注

45
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
求导（前向求导和反向求导）

多次前向求导才能求得z对x1,x2,x3的导数；一次反向求导即可求得z对x1,x2,x3的导数。前向求导：一个输入对所有结点的影响。反向求导：所有结点对一个输出的影响。
复制链接

扫一扫

专栏目录