当我们使用 Tensorflow 来创建数据时,我们需要了解 tensor
的数据结构,以便我们对于数据有直观的认识。下面我们来介绍一下 tensor
数据有哪些属性。
Tensor
Tensor 本质是多维数组,并且数组里只能包含一种类型的数据,比如全部是 float
或者全部是int
,并且 tensor
是不能更改的,因此创建后,只能在此基础上再创建新的 tensor
。
Rank
rank
表示维度的数量,因为 tensor
是多维度的,维度可以简单理解成坐标系,所以 tensor
可以有多个坐标系。让我们来看一下 rank 为 0-2 的 tensor
。
rank_0_tensor = tf.constant(4);
rank 为 0 的 tensor
可以理解为一个 scalar,在我们线性代数里常见的 scalar
。
rank_1_tensor = tf.constant([1.0, 2.0, 3.0]);
rank 为 1 的 tensor
可以理解为一个向量。
rank_2_tensor = tf.constant([[1,2], [3,4], [5,6]]);
rank 为 2 的 tensor
可以理解为一个矩阵。
Shape
每个维度所含元素的数量,其中 Shape
返回的是一个 list
,list
的长度就等于 Rank
,其中 list
的数据顺序是有一个特定的数据。
Shape 返回值的数据顺序
在 tensor
中,tensor.shape
返回的 list
值是有特定顺序的;以 tensor_4_rank
举例,Shape 对应的第一个值是 batch size
,第二个值是 height
,第三个值是 width
,第四个值是 feature
。(Shape 可以被理解成不同的形状结构,但无论是哪种结构,所有的数据顺序依然保持一致,比如第一个数组是永远是在结构的第一个位置,以此类推)
tensor 元素数量
Shape 返回的 lisrt
的所有值相乘,就是tensor
所有值的数量。比如我们通过 tensor.shape
得到一个 list 为 [1,2,3]
,则该 tensor
的所有数据个数为 1 * 2 * 3 = 6。