07自动求导【动手学深度学习v2】

勿分心111222

已于 2022-11-09 21:21:53 修改

阅读量95

点赞数

分类专栏：李沐深度学习文章标签：深度学习人工智能 pytorch

于 2022-11-09 17:51:03 首次发布

原文链接：https://blog.csdn.net/anelance/article/details/122782177

版权

李沐深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

import torch
x=torch.arange(4.0) #创建向量，里面的数值是0 1 2 3
print(x)


#在计算y关于x的梯度之前，我需要一个地方来存储梯度
x_grad = x.requires_grad_(True) #该语句即为告知我需要存储梯度，等价于x=torch.arange(4.0,requires_grad = True)

x.grad#即可访问x的梯度，即y关于x的导数放在这里
print(x_grad)#
 
#现在来计算y
y = 2*torch.dot(x,x)
print(y)
'''
计算方法【不知道对不对】
tensor(28., grad_fn=<MulBackward0>) grad_fn是gradient function隐式的构造计算图
x = 0,1,2,3
y = (0+1*1+2*2+3*3)*2 = (0+1+4+9)*2 = 14*2 = 28
'''
#通过反向传播函数计算y关于x每个分量的梯度
y.backward() #求导，通过x.grad来访问我的导数，y = 2*torch.dot(x,x) dot是内积，就是自己*自己
x_grad == 4 * x
 
print('x_grad is',x_grad)
 
#在默认情况下，pytorch会积累梯度，我们需要清除之前的值
x.grad.zero_() #下划线表示重新内容，就是把0写进梯度里，就是把梯度清零
y = x.sum()
y.backward()
print(x.grad) #tensor([1., 1., 1., 1.])，如果没有清零的那一行，答案是tensor([ 1.,  5.,  9., 13.])
 
#假设y不是标量，对非标量调用backward需要传入一个gradient参数，该参数指定唯粉函数
x.grad.zero()
y = x * x
#等价于y.backward(torch.ones(len(x)))
y.sum().backward()#我们很少对向量的函数求导，大部分对标量求导，所以对y求和再来求导
print(x.grad)

假设y是作为x的函数，而z则是作为y和x的函数。

x.grad.zero_()#梯度清零
y = x * x
u = y.detach()#现在把y当成一个常数，而不是关于x的函数
z = u * x#那么现在把y替换成u，再对x求导时，结果就为u

z.sum().backward()
x.grad == u

#此时我们还是可以让y对x求导，求导之后为2x

x.grad.zero_()
y.sum().backward()
x.grad == 2 * x

tensor([True, True, True, True])

我们现在可以分析上面定义的f函数。请注意，它在其输入a中是分段线性的。换言之，对于任何a，存在某个常量标量k，使得f(a)=k*a，其中k的值取决于输入a。因此，d/a允许我们验证梯度是否正确。

a.grad == d / a

tensor(True)

勿分心111222

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
07自动求导【动手学深度学习v2】

import torchx=torch.arange(4.0) #创建向量，里面的数值是0 1 2 3print(x)#在计算y关于x的梯度之前，我需要一个地方来存储梯度x_grad = x.requires_grad_(True) #该语句即为告知我需要存储梯度，等价于x=torch.arange(4.0,requires_grad = True)x.grad#即可访问x的梯度，即y关于x的导数放在这里print(x_grad)# #现在来计算yy = 2*torch.dot(x,x)p
复制链接

扫一扫