07 自动求导【动手学深度学习v2】

最新推荐文章于 2023-03-23 22:16:06 发布

sueong

最新推荐文章于 2023-03-23 22:16:06 发布

阅读量673

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/sueong/article/details/123927567

版权

PyTorch 自动求导链式法则梯度反向传播

关键词由CSDN通过智能技术生成

pytorch 专栏收录该内容

23 篇文章 10 订阅

订阅专栏

向量的链式法则

例子

在这里插入图片描述

自动求导

在这里插入图片描述

显示构造和隐示构造

显示构造之后给a和b传入值类似公式代入一样先给公式定义再传值
在这里插入图片描述
隐示构造

链式法则中求导：正向和反向

对于链式公式
正向：从后往前向前
反向：从前往后想后

在这里插入图片描述

在这里插入图片描述

自动求导

在这里插入图片描述

import torch

x = torch.arange(4.0)
x.requires_grad_(True)# 等价x = torch.arange(4,requires_grad=True) 等于True是需要存储梯度
print(x)
print(x.grad)# 默认是None
y = 2 * torch.dot(x,x)
print(y)
'''
tensor([0., 1., 2., 3.], requires_grad=True)
None
显示构造
tensor(28., grad_fn=<MulBackward0>)
28=2*(0^1+1^2+2^2+3^2)
'''
# 调用反向传播来计算y对x每个分量的梯度
print(y.backward())
print(x.grad)
print(x.grad == 4 * x)
'''
None
tensor([ 0.,  4.,  8., 12.])
tensor([True, True, True, True])
'''

在这里插入图片描述

# pytorch中会累积梯度 我们需要清除之前的值
print('x:',x)
x.grad.zero_()
y = x.sum()# 等价于x1+...+xn 然后对xi求导 所以求导结果是常数1
print('y:',y)
y.backward()
print('x.grad:',x.grad)
'''
x: tensor([0., 1., 2., 3.], requires_grad=True)
y: tensor(6., grad_fn=<SumBackward0>)
x.grad: tensor([1., 1., 1., 1.])
'''

大部分我们都是对标量求导在这里插入图片描述

# pytorch中会累积梯度 我们需要清除之前的值
print('x:',x)
x.grad.zero_()
y = x*x
print('y',y)
u = y.detach() # u变成常数 与x无关
print('u',u)
z = u*x
z.sum().backward()
print(x.grad == u)
'''
x: tensor([0., 1., 2., 3.], requires_grad=True)
y tensor([0., 1., 4., 9.], grad_fn=<MulBackward0>)
u tensor([0., 1., 4., 9.])
tensor([True, True, True, True])
'''

在这里插入图片描述

y.sum().backward()和y.backward()的区别

y.backward() 是因为之前的
y = 2 * torch.dot(x,x) tensor(28., grad_fn=<MulBackward0>) 已经求和过了
y是个标量

因此当输出不是标量时，调用.backwardI()就会出错

x = torch.arange(4.0)
x.requires_grad_(True)# 等价x = torch.arange(4,requires_grad=True) 等于True是需要存储梯度
print(x)
print(x.grad)# 默认是None
y = 2 * torch.dot(x,x)
print(y)
'''
tensor([0., 1., 2., 3.], requires_grad=True)
None
显示构造
tensor(28., grad_fn=<MulBackward0>)
28=2*(0^1+1^2+2^2+3^2)
'''

x.grad.zero_()
y = x*x
print('y',y)
y.sum().backward()
print(x.grad == 2*x)
'''
None
tensor([ 0.,  4.,  8., 12.])
tensor([True, True, True, True])
'''

torch会把计算图存下来然后再倒着推一遍在这里插入图片描述

import torch


def f(a):
    b = a*2
    while b.norm()< 1000:
        b = b*2
    if b.sum()> 0:
        c = b
    else:
        c = 100*b
    print('a,b,c',a,b,c)
    return c


# size=()表示标量
a = torch.randn(size=(), requires_grad=True)
print(a)
d = f(a)
print('d.backward()', d.backward())
print('a.grad', a.grad)
print(a.grad == d/a)
'''
tensor(0.8685, requires_grad=True)
a,b,c tensor(0.8685, requires_grad=True) tensor(1778.7827, grad_fn=<MulBackward0>) tensor(1778.7827, grad_fn=<MulBackward0>)
d.backward() None
a.grad tensor(2048.)
tensor(True)

'''