二）PyTorch入门基础串讲（一）

Allen’s hub

于 2023-04-10 22:32:08 发布

阅读量212

点赞数

分类专栏： pytorch入门到进阶文章标签： pytorch 机器学习深度学习 python 人工智能

本文链接：https://blog.csdn.net/Engineering_/article/details/130071569

版权

pytorch入门到进阶专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了PyTorch中的Tensor基础知识，包括Tensor的定义、创建、属性、运算以及稀疏张量和广播机制。内容涵盖张量与机器学习的关系、张量的加减乘除等基本运算、矩阵乘法、对数和幂运算，以及如何进行等式比较、取前k大/小元素。此外，还讨论了PyTorch中的in_place操作、张量函数和随机抽样种子设置。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1，机器学习中的分类与回归问题

输入变量与输出变量均为连续变量的问题称为回归问题

输出变量为有限个离散变量的预测问题是分类问题

机器学习的构成元素：

样本（特征和数量），模型，训练（获得参数），推理（计算标签），测试（评价模型）

2，Tensor与机器学习

采用张量描述高维的数据空间，是对标量，向量，矩阵，高维向量的一个统称。标量（矩阵或向量中每一个元素）就是零阶张量，向量是一阶张量以此类推。
机器学习中需要用变量来表达参数，对于建立的模型，其参数是未知的那参数就是变量，并且，pytorch中自带了对这些变量的自动求导功能。
nn.Module封装了搭建深度学习模型的积木元素

3，Tensor的基本定义

张量
用来描述样本和模型参数
可以和numpy互换
Tensor描述数据类型就是在数据类型前加torch.（eg: torch.float64, torch.int8）

4，Tensor的创建

栗子：

基础构造

注意创建张量，圆括号里必须是是list，也就是最外围一定有个方括号，二维张量就是方括号套着方括号，俩层。不加方括号的话就是创建一个size的张量：

这些值都是初始化的随机的值，或者是当前内存中的值

除此之外还可以利用zeros_like或者ones_like创建与对象一样大小的张量，没有eye_like：

随机：

随机生成的数是在[0,1)区间。当我们看normal的源码时候会发现其中的参数均值和方差既可以是张量又可以是浮点型，当mean和std参数都是_float型时需要额外指定size参数：

这里先生成五种标准差的tensor，之后每种标准差和mean=0.0组合生成不同的正态分布的函数。之后我们就可以从这五组正态分布函数中再生成五个数。通常用于数据的初始化。

同样的是uniform均匀分布，但此时我们需要指定Tensor的大小，再去定义。

序列：

注意从0开始，步长为1，不包含10

随机序列：

与numpy对比：

功能和结构和Tensor基本是相同的，但是使用时需要互相交互，转换

5，Tensor的属性

每一个Tensor有torch.dtype, torch.devize, torch.layout三种属性
torch.dtype标识数据类型
torch.device标识了torch.Tensor对象再创建之后所存储再设备的名称，CPU, GPU
torch.layout表示torch.Tensor内存布局的对象（数据结构中，表示稠密存储或者稀疏存储）

稠密张量：

一般不申明都是稠密张量

稀疏张量：

表达形式：torch.sparse_coo_tensor，其中coo类型表示了非零元素的坐标形式
什么是稀疏：表达了数据中非零元素的个数，0越多，数据越稀疏；在线性代数中的秩也可以表示数据的可线性表示关系，秩越小，能相互表示可能性越大。
通过稀疏，可以把模型变得更加简单，并且可以减小内存的开销，因此在存储稀疏的数据或模型时可以用稀疏张量进行存储，只记录非零元素的坐标。这种方法，尤其在深度学习中可以极大的减少内存消耗！

比如：