3.1.1 数据结构
在介绍数据的处理之前,先理解一下在机器学习领域,数据科学家是如何看待数据的,数据可以分成标量 (Scalar)、向量 (Vector)、矩阵 (Matrix)、张量 (Tensor)。简单来说,0 维的张量就是标量,1 维的张量就是向量,2 维的张量就是矩阵, 3 维以上的张量则统一称为张量。
以下使用 NumPy 为例来创建向量、矩阵、张量,因为标量是单纯的数据,所以直接指定即可。
实例
# 标量
a=1
# 向量
import numpy as np
# 创建一个向量
vector = np.array([1,2,3])
print(vector.shape)
print(vector)
# 创建一个矩阵
matrix = np.array([[1,2,3],[2,3,4]])
print(matrix.shape)
print(matrix)
# 创建一个张量
tensor = np.array([[[1,2,3],[2,3,4]],
[[1,2,3],[2,3,4]]])
print(tensor.shape)
print(tensor)
# 输出结果如下:
(3,)
[1 2 3]
(2, 3)
[[1 2 3]
[2 3 4]]
(2, 2, 3)
[[[1 2 3]
[2 3 4]]
[[1 2 3]
[2 3 4]]]
图 3-1-1 透过 Jupyter Notebook 操作练习