PyTorch学习Task02 PyTorch基础知识

最新推荐文章于 2024-07-07 17:05:20 发布

Cu�+

最新推荐文章于 2024-07-07 17:05:20 发布

阅读量102

点赞数

文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/weixin_46629813/article/details/120792566

版权

PyTorch基础知识

张量
自动求导
梯度
并行计算

张量

标量视为零阶张量，矢量可以视为一阶张量，矩阵就是二阶张量

3维=时间序列
4维=图像
5维=视频

张量像一个数据容器
torch.Tensor 是存储和变换数据的主要工具
与numpy类似
在这里插入图片描述
更多函数看文档（明天有时间打一下，今天实在没时间。）

自动求导

PyTorch里神经网络能够训练就是靠autograd包。autograd 包提供了对张量的所有运算自动求导。它是一个在运行时定义 ( define-by-run ）的框架，这意味着反向传播是根据代码如何运行来决定的，并且每次迭代可以是不同的。

如果设置它的属性 .requires_grad 为 True，那么它将会追踪对于该张量的所有操作。当完成计算后可以通过调用 .backward()，来自动计算所有的梯度。这个张量的所有梯度将会自动累加到.grad属性。

梯度

数学上，若有向量函数 $\vec{y}=f(\vec{x})$ ，那么 $\vec{y}$ 关于 $\vec{x}$ 的梯度就是一个雅可比矩阵：
$J=\left(\begin{array}{ccc}\frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{1}}{\partial x_{n}} \ \vdots & \ddots & \vdots \ \frac{\partial y_{m}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}}\end{array}\right)$ 而
torch.autograd 这个包就是用来计算一些雅可比矩阵的乘积的。例如，如果 $v$ 是一个标量函数 $g(\vec{y})$
的梯度： $v=\left(\begin{array}{lll}\frac{\partial l}{\partial y_{1}} & \cdots & \frac{\partial l}{\partial y_{m}}\end{array}\right)$
由链式法则，我们可以得到： $J=\left(\begin{array}{lll}\frac{\partial l}{\partial y_{1}} & \cdots & \frac{\partial l}{\partial y_{m}}\end{array}\right)\left(\begin{array}{ccc}\frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{1}}{\partial x_{n}} \ \vdots & \ddots & \vdots \ \frac{\partial y_{m}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}}\end{array}\right)=\left(\begin{array}{lll}\frac{\partial l}{\partial x_{1}} & \cdots & \frac{\partial l}{\partial x_{n}}\end{array}\right)$

在这里插入图片描述
一些求梯度的步骤

并行计算

在PyTorch使用 CUDA表示要开始要求我们的模型或者数据开始使用GPU了。

在编写程序中，当我们使用了 cuda() 时，其功能是让我们的模型或者数据迁移到GPU当中，通过GPU开始计算。

Cu�+

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch学习Task02 PyTorch基础知识

PyTorch基础知识张量自动求导梯度并行计算张量标量视为零阶张量，矢量可以视为一阶张量，矩阵就是二阶张量3维=时间序列4维=图像5维=视频张量像一个数据容器torch.Tensor 是存储和变换数据的主要工具与numpy类似更多函数看文档（明天有时间打一下，今天实在没时间。）自动求导PyTorch里神经网络能够训练就是靠autograd包。autograd 包提供了对张量的所有运算自动求导。它是一个在运行时定义 ( define-by-run ）的框架，这意味着反向传播是根
复制链接

扫一扫