【深入浅出PyTorch】2-pytorch基础知识

超级虚空

已于 2022-07-11 16:24:51 修改

阅读量397

点赞数

文章标签： pytorch 深度学习 python 机器学习

于 2022-07-11 15:45:58 首次发布

本文链接：https://blog.csdn.net/m0_49376775/article/details/125722757

版权

深入浅出PyTorch 专栏收录该内容

4 篇文章 2 订阅

订阅专栏

本文介绍了PyTorch中的核心概念，包括张量的定义与创建，以及自动求导的原理和动态计算图的工作机制。张量是PyTorch的基础数据结构，支持GPU运算和自动求导。自动求导通过计算图实现，结合链式法则进行高效反向传播。此外，文章还简要提及了并行计算在PyTorch中的应用。

摘要由CSDN通过智能技术生成

2-pytorch基础知识

文章目录

2-pytorch基础知识

2.1-张量

2.1.1-什么是张量

张量（Tensor）是一个定义在一些向量空间和一些对偶空间的笛卡尔积上的多重线性映射，其坐标是|n|维空间内，有|n|个分量的一种量

——百度百科

从数值到向量，再到矩阵，量的维度不断升高，那么超过3维的我们都可以称作张量，不过更一般的，任何维度都可以用张量表示，如数值就是0维，向量1维，矩阵2未，而上图中的张量就是一个三维的张量。

维度不限，通常为3维
pytorch的基本运算单元
pytorch中基础的数据定义和运算会频繁地用到张量的特性
张量在pytorch中支持GPU运算、自动求导等操作

2.1.2-创建tensor

见 2.1.2-创建tensor.ipynb

2.2-自动求导

2.2.1-PyTorch机制

PyTorch是如何实现模型训练的：

输入数据，正向传播
创建计算图
计算损失函数
损失函数反向传播
更新模型参数

2.2.2-数学基础

多元函数求导的雅各比矩阵：
$J=\left(\begin{array}{ccc}\frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{1}}{\partial x_{n}} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_{m}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}}\end{array}\right)$
假设有 $m$ 个因变量 $y_1,\dots,y_m$ , 和 $n$ 个自变量 $x_1,\dots,x_n$ , 那么 $Y$ 对 $X$ 的导数可以用矩阵 $J$ 的形式表示出来。

链式求导法则：

若 $h (x) = f (g (x))$ ，则 $h^{\prime}(x) = f^\prime(g(x))*g^{\prime}(x)$

PyTorch自动求导：

损失函数 $l$ 对输出 $y$ 的导数为
$v=\left(\begin{array}{lll}\frac{\partial l}{\partial y_{1}} & \cdots & \frac{\partial l}{\partial y_{m}}\end{array}\right)$
那么 $l$ 对输入 $x$ 的导数为
$J=\left(\begin{array}{lll}\frac{\partial l}{\partial y_{1}} & \cdots & \frac{\partial l}{\partial y_{m}}\end{array}\right)\left(\begin{array}{ccc}\frac{\partial y_{1}}{\partial x_{1}} & \cdots & \frac{\partial y_{1}}{\partial x_{n}} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_{m}}{\partial x_{1}} & \cdots & \frac{\partial y_{m}}{\partial x_{n}}\end{array}\right)=\left(\begin{array}{lll}\frac{\partial l}{\partial x_{1}} & \cdots & \frac{\partial l}{\partial x_{n}}\end{array}\right)$