07 自动求导【基本看不懂】

最新推荐文章于 2022-09-12 17:12:06 发布

没有出口的猎户座

最新推荐文章于 2022-09-12 17:12:06 发布

阅读量1k

点赞数 1

分类专栏：李沐机器学习文章标签： python 人工智能

本文链接：https://blog.csdn.net/anelance/article/details/122782177

版权

李沐机器学习专栏收录该内容

21 篇文章 18 订阅

订阅专栏

import torch
#假设我们想对函数y=2x^Tx，关于列向量x 求导

x=torch.arange(4.0) #创建向量，里面的数值是0 1 2 3
print(x)

#在计算y关于x的梯度之前，我需要一个地方来存储梯度
x_grad = x.requires_grad_(True) #等价于 x=torch.arange(4.0,requires_grad = True)
print(x_grad)

#现在来计算y
y = 2*torch.dot(x,x)
print(y)
'''
计算方法【不知道对不对】
tensor(28., grad_fn=<MulBackward0>) grad_fn是gradient function
x = 0,1,2,3
y = (0+1*1+2*2+3*3)*2 = (0+1+4+9)*2 = 14*2 = 28
'''
#通过反向传播函数计算y关于x每个分量的梯度
y.backward() #求导，通过x.grad来访问我的导数，y = 2*torch.dot(x,x) dot是内积，就是自己*自己
x_grad == 4 * x

print('x_grad is',x_grad)

#在默认情况下，pytorch会积累梯度，我们需要清除之前的值
x.grad.zero_() #下划线表示重新内容，就是把0写进梯度里，就是把梯度清零
y = x.sum()
y.backward()
print(x.grad) #tensor([1., 1., 1., 1.])，如果没有清零的那一行，答案是tensor([ 1.,  5.,  9., 13.])

#深度学习中，我们的目的不是计算微分矩阵，而是批量中每个样本单独计算的偏导数之和
#假设y不是标量，对非标量调用backward需要传入一个gradient参数，该参数指定唯粉函数
x.grad.zero()
y = x * x
#等价于y.backward(torch.ones(len(x)))
y.sum().backward()
print(x.grad)

没有出口的猎户座

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
07 自动求导【基本看不懂】

import torch#假设我们想对函数y=2x^Tx，关于列向量x 求导x=torch.arange(4.0) #创建向量，里面的数值是0 1 2 3print(x)#在计算y关于x的梯度之前，我需要一个地方来存储梯度x_grad = x.requires_grad_(True) #等价于 x=torch.arange(4.0,requires_grad = True)print(x_grad)#现在来计算yy = 2*torch.dot(x,x)print(y)'''计算.
复制链接

扫一扫