作者|Soner Yıldırım 编译|VK 来源|Towards Data Science
机器学习和深度学习模型需要大量的数据。它们的性能在很大程度上取决于数据量。因此,我们倾向于收集尽可能多的数据,以建立一个稳健和准确的模型。数据以多种不同的格式收集,从数字到图像,从文本到声波。然而,我们需要将数据转换为数字以便对其进行分析和建模。
仅仅将数据转换为标量(单个数字)是不够的。随着数据量的增加,使用标量的操作开始变得低效。我们需要向量化或矩阵运算来有效地进行计算。这就是线性代数发挥作用的地方。
线性代数是数据科学领域的重要课题之一。在这篇文章中,我们将通过使用NumPy的例子来介绍线性代数的基本概念。
NumPy是Python的一个科学计算库,是许多库(比如Pandas)的基础。
线性代数中的对象类型
线性代数中的对象(或数据结构)类型:
标量:单个数字
向量:数字数组
矩阵:二维数字数组
张量:N>2的N维数列
标量就是一个数字。我们将在下面的示例中看到,它可以用于向量化操作。
向量是一组数字。例如,5个元素的向量: