PyTorch 基础操作实践-CSDN博客

本文链接：https://blog.csdn.net/wwangxubin/article/details/147961675

在深度学习框架 PyTorch 的使用中，理解和掌握一些基础操作至关重要，下面将对相关操作进行总结。

广播机制

广播机制允许不同形状的张量进行运算。例如，使用 torch.arange 函数创建张量 a ，其形状为 (3, 1) ，表示有 3 行 1 列；再创建张量 b ，形状为 (1, 2) ，即 1 行 2 列。当执行 a + b 操作时，PyTorch 会依据广播机制自动扩展张量维度，使二者能够进行相加运算，最终输出符合预期的结果张量。这种机制在处理不同形状数据的运算时，提供了极大的便利性，减少了手动调整张量形状的繁琐操作。

索引和切片

通过 torch.arange 函数创建一个形状为 (3, 4) 的张量 x 。在索引操作中，x[-1] 能够获取张量 x 的最后一行元素，这是基于 Python 中负数索引从后往前计数的规则；x[1:3] 则获取第 2 行到第 3 行（不包含第 3 行）的元素，这是典型的切片操作，用于获取张量的某一连续部分。同时，我们还可以对张量进行赋值修改。像 x[1, 2] = 9 这样的操作，就是将张量 x 中第 2 行第 3 列的元素修改为 9 ；而 x[0:2, :] = 12 则是通过切片赋值，把张量 x 的前两行所有元素都赋值为 12 。这些索引和切片操作，方便我们灵活地访问和修改张量中的元素，满足各种数据处理需求。

节省内存

在张量运算过程中，内存管理是一个关键问题。以变量 Y 为例，当执行 Y = Y + X 操作时，通过 id 函数获取 Y 在操作前后的内存地址，会发现地址发生了改变，这表明这种操作方式创建了新的张量对象，占用了新的内存空间。为了实现原地操作节省内存，可以先使用 torch.zeros_like 创建与 Y 形状相同且元素全为 0 的张量 Z ，然后通过 Z[:] = X + Y 这种切片赋值方式进行运算，此时 Z 的内存地址保持不变，达到了原地操作的目的。另外，像 X += Y 这样的操作，对于 X 而言是原地操作，其内存地址不会改变。合理运用这些内存管理技巧，能够在处理大规模数据时，有效减少内存消耗，提高程序运行效率。

转换为其他 Python 对象

在实际应用中，常常需要在张量与其他 Python 对象之间进行转换。使用 numel 方法可以获取张量 X 的元素个数，得到的结果 A 是 Python 的 int 类型；若将 A 转换为张量 B ，则 B 属于 torch.Tensor 类型。对于单元素张量 a ，可以通过 item 方法获取其值并转换为 Python 标量，同时也能够将其进一步转换为 float 或 int 类型。这种灵活的类型转换，使得 PyTorch 能够更好地与 Python 的其他模块和数据结构进行交互，拓展了其应用场景。