pytorch求导

最新推荐文章于 2022-12-15 20:09:12 发布

隋遥

最新推荐文章于 2022-12-15 20:09:12 发布

阅读量729

点赞数

分类专栏：机器学习文章标签： pytorch 神经网络机器学习深度学习

本文链接：https://blog.csdn.net/aa997749935/article/details/105328323

版权

机器学习专栏收录该内容

2 篇文章 2 订阅

订阅专栏

pytorch求导

pytorch求导

pytorch求导

主要记录一下backward()函数以及torch.autograd.grad()函数的使用，并重点探究一下对应的creat_graph以及retain_graph参数的使用。
首先定义函数：

import torch
from torch.autograd import Variable
def f(x):
    y = x ** 3
    return y

1. backward()

主要用于对loss的求导，并将求出的梯度存入叶子节点对应的buffer内。
其中，retain_graph=True是保留整个计算图不被销毁，这样可以多次backward()，但是要注意梯度是多次累积的。

def main1():
    x = Variable(torch.tensor([5.0]), requires_grad=True)
    y = f(x)
    y.backward(retain_graph=True)
    print(x.grad) # 75
    y.backward(retain_graph=True)
    print(x.grad) # 75 + 75
    y.backward()
    print(x.grad) # 75 + 75 + 75

2. torch.autograd.grad()

首先利用torch.autograd.grad()函数进行求导不会在叶子节点的buffer内保留梯度
输出的结果为tuple类型，即为一阶导数的值
当使用creat_graph=True时，可以计算高阶导数，此时grad_x.requires_grad自动为True

def main2():
    x = Variable(torch.tensor([5.0]), requires_grad=True)
    grad_x = torch.autograd.grad(f(x), x, create_graph=True)
    print(grad_x)  # 一阶导数 75  grad_x.requires_grad == True
    grad_grad_x = torch.autograd.grad(grad_x[0], x, create_graph=True)
    print(grad_grad_x) # 二阶导数 30  requires_grad == True
    grad_grad_grad_x = torch.autograd.grad(grad_grad_x[0], x)
    print(grad_grad_grad_x) # 三阶导数 6  requires_grad == False

其中另一个参数retain_graph=True表示的是保留计算图的结果，这样在backward()的时候会进行累积，单独使用不可以求二阶导，这是因为requires_grad == False，下面两段代码会报错

def main3():
    x = Variable(torch.tensor([5.0]), requires_grad=True)
    grad_x = torch.autograd.grad(f(x), x, retain_graph=True)
    print(grad_x)
    grad_grad_x = torch.autograd.grad(grad_x[0], x, retain_graph=True)
    print(grad_grad_x)
    grad_grad_grad_x = torch.autograd.grad(grad_grad_x[0], x)
    print(grad_grad_grad_x)
    
def main4():
    x = Variable(torch.tensor([5.0]), requires_grad=True)
    grad_x = torch.autograd.grad(f(x), x, retain_graph=True)
    print(grad_x)
    grad_x[0].backward()
    print(x.grad)

3. 混合使用

def main5():
    x = Variable(torch.tensor([5.0]), requires_grad=True)
    grad_x = torch.autograd.grad(f(x), x, create_graph=True)
    print(grad_x)  # 一阶导数 75
    grad_x[0].backward()
    print(x.grad) # buffer内存的是30，也就是二阶导数的值

隋遥

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch求导

pytorch求导pytorch求导1. backward()2. torch.autograd.grad()3. 混合使用pytorch求导主要记录一下backward()函数以及torch.autograd.grad()函数的使用，并重点探究一下对应的creat_graph以及retain_graph参数的使用。首先定义函数：import torchfrom torch.autogr...
复制链接

扫一扫