PyTorch入门 — — autograd（一）

最新推荐文章于 2023-03-06 16:22:59 发布

小北的北

最新推荐文章于 2023-03-06 16:22:59 发布

阅读量176

点赞数

文章标签：神经网络 python 深度学习人工智能 tensorflow

本文链接：https://blog.csdn.net/weixin_38739735/article/details/109673539

版权

在阅读PyTorch入门后，我们可以理解：训练一个模型实际上就是寻找一组能够使得损失函数取值最小的参数值。在寻找该参数值时，我们需要计算该损失函数关于当前参数的梯度，因此如何求得梯度值至关重要。

一般来说，对于一个简单的目标函数，我们可以手动计算其梯度，但当表达式过于复杂、目标函数不断发生变化的时候，我们就很难通过求解数学方程来计算该复合函数的梯度。目前，我们大部分人更能接受4维以下的空间，而当这些曲线存在于更高维度空间时，曲线太过抽象让我们难以理解。

由此，PyTorch的autograd应运而生，他将复杂的数学知识抽象处理，仅仅几行代码便可以帮助我们计算出高维曲线的梯度。它抽象了复杂的数学，并帮助我们“神奇地”仅用几行代码即可计算出高维曲线的梯度。本文试图用相对条理且循序渐进的方式帮助大家理解autograd。

在深入介绍autograd前，我们需要先了解一些基本的PyTorch的概念：

Tensor：张量

简单来说，张量就是PyTorch中的一个n (n>=0)维的数组结构。除数组原有的属性外，张量还支持一些其他增强功能，使其具有独特性。例如：除CPU外，还可以加载它们到GPU上以进行更快的计算；也可以通过设置.requires_grad = True（自己定义的Tensor的默认属性为False，神经网络中表达权重的Tensor默认属性为True），以跟踪所有对于该张量的操作，便于后面通过调用.backward()自动计算梯度。

在PyTorch比较早期的版本中，可以使用torch.autograd.Variable类进行创建支持梯度计算和跟踪的张量，torch.autograd.Variable包含以下5个属性：data、grad、grad_fn、requires_grad、is_leaf。但较新的PyTorch版本已经不太推荐使用Variable类了，而转为使用 torch.Tensor，他在torch.autograd.Variable的基础上，又增加了dtype、shape、device三个属性。

import torch
import numpy as np


x = torch.randn(2, 2, requires_grad = True)


# 定义float类型的numpy数组
x = np.array([1., 2., 3.]) 
x = torch.from_numpy(x)
# 设置计算梯度功能可用
x.requires_grad_(True)

注意：根据PyTorch的设计规则，目前只能为浮点张量计算梯度。因此在上述实例中，我们先创建了一个float类型的numpy数组，再将其转为Tensor类型进行梯度计算。

autograd

autograd包为张量上的所有操作提供了自动求导的功能，他生成了一个动态循环图，并在该图上记录了张量所有执行的操作历史。此图的“叶”为输入张量，“根”为输出张量，梯度的计算过程是通过从根到叶跟踪图并使用链法则将每个梯度相乘。

· END ·

RECOMMEND