如何使用torch计算梯度，理解Autograd的作用及原理

最新推荐文章于 2023-02-24 01:09:30 发布

rpsate

最新推荐文章于 2023-02-24 01:09:30 发布

阅读量1.8k

点赞数 4

分类专栏： deep learning 文章标签： pytorch python 深度学习 detach torch.no_grad

本文链接：https://blog.csdn.net/rpsate/article/details/127142343

版权

deep learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 介绍Tensor

在PyTorch中主要是通过torch.Tensor存储和计算数据，Tensor可以表示数值，向量或矩阵。假设x=torch.tensor(3.0),当x的requires_grads参数为True时，它跟踪x参与的运算。并且在计算得到的结果上(结果也是Tensor一个对象)上调用backward()就会自动计算x的梯度，并将梯度累加到x.grad属性上。下面代码演示在 $y=x^2$ ，求 $x = 3$ 时的梯度。

import torch
x = torch.tensor(3., requires_grad=True)
y = x**2
y.backward()
print(x.grad)

tensor(6.)

2. detach()的作用

为了防止x的的计算被跟踪，可以使用detach()方法获取x的值(x.detach()和x共享内存)。例如在 $y=x^2+x^3$ 式子求梯度时，我想忽略 $y=x^2$ 这一项就需要用到x.detach()了。

import torch
x = torch.tensor(3., requires_grad=True)
y = x.detach()**2 + x**3
y.backward()
print(x.grad)

tensor(27.)

3. torch.no_grad()的作用

torch.no_grad()的作用和detach()类似，也是为了防止追踪历史，只是使用方法不同。例如下面式子中不会跟踪 $y=x^2$ 这个运算，所以我们需要把 $x^2$ 看成一个常数，那么计算梯度时就要把 $y=x+x^2$ 看成 $y = x + 6$ ，那么x=3时的梯度就是1。

import torch
x = torch.tensor(3., requires_grad=True)
with torch.no_grad():
    y = x*2
y = x + y
y.backward()
print(x.grad)

tensor(1.)

4. 参考文献：

https://www.cnblogs.com/Thinker-pcw/p/9630367.html

rpsate

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
如何使用torch计算梯度，理解Autograd的作用及原理

在PyTorch中主要是通过存储和计算数据，Tensor可以表示数值，向量或矩阵。假设,当x的参数为True时，它跟踪x参与的运算。并且在计算得到的结果上(结果也是Tensor一个对象)上调用backward()就会自动计算x的梯度，并将梯度累加到x.grad属性上。下面代码演示在y=x2y=x^2y=x2，求x=3x=3x=3时的梯度。tensor(6.)
复制链接

扫一扫