1.张量是什么?
张量是数学和物理学中的一种广义的“数组”概念,用于表示具有多维结构的数据。在机器学习和深度学习中,张量是数据的基本单位,可以视为向量和矩阵的泛化。
2.环境准备
导入所需的模块
3.创建张量
创建张量方式有多种
1.根据数据直接生成
2.从NumPy数组生成
3.使用init初始化器构造张量
4.继承另一个张量的属性,形成新的张量
4.张量的属性
- 形状(shape):Tensor的shape,是一个tuple。
- 数据类型(dtype):Tensor的dtype,是MindSpore的一个数据类型。
- 单个元素大小(itemsize): Tensor中每一个元素占用字节数,是一个整数。
- 占用字节数量(nbytes): Tensor占用的总字节数,是一个整数。
- 维数(ndim): Tensor的秩,也就是len(tensor.shape),是一个整数。
- 元素个数(size): Tensor中所有元素的个数,是一个整数。
- 每一维步长(strides): Tensor每一维所需要的字节数,是一个tuple
5.张量索引
6.张量运算
普通算术运算有:加(+)、减(-)、乘(*)、除(/)、取模(%)、整除(//)。
concat将给定维度上的一系列张量连接起来。
satck则是从另一个维度上将两个张量合并起来。
7.Tensor与NumPy转换
1.Tensor转换为NumPy
张量创建相同,使用Tensor.asnumpy()将Tensor变量转换为NumPy变量
2.NumPy转换为Tensor
使用Tensor()将NumPy变量转换为Tensor变量。
8.稀疏张量
稀疏张量:一种特殊的张量,绝大部分的元素值为零。
在某些应用场景中(比如推荐系统、分子动力学、图神经网络等),数据的特征是稀疏的,若使用普通张量表征这些数据会引入大量不必要的计算、存储和通讯开销。这时就可以使用稀疏张量来表征这些数据。
CSRTensor
CSR(Compressed Sparse Row )稀疏张量格式有着高效的存储与计算的优势。其中,非零元素的值存储在values中,非零元素的位置存储在indptr(行)和indices(列)中。各参数含义如下:
-
indptr: 一维整数张量, 表示稀疏数据每一行的非零元素在values中的起始位置和终止位置, 索引数据类型支持int16、int32、int64。
-
indices: 一维整数张量,表示稀疏张量非零元素在列中的位置, 与values长度相等,索引数据类型支持int16、int32、int64。
-
values: 一维张量,表示SCRTensor相对应的非零元素的值,与values长度相等。
-
shape: 表示被压缩的稀疏张量的形状,数据类型为Tuple,目前仅支持二维SCRTensor。
使用示例
COOTensor
COO(Coordinate Format)稀疏张量格式用来表示某一张量在给定索引上非零元素的集合,若非零元素的个数为N
,被压缩的张量的维数为ndims。各参数含义如下:
-
indices: 二维整数张量,每行代表非零元素下标。形状:
[N,
ndims]
, 索引数据类型支持int16、int32、int64。 -
values: 一维张量,表示相对应的非零元素的值。形状:
[N]
。 -
shape: 表示被压缩的稀疏张量的形状,目前仅支持二维COOTensor。
使用示例