2021-08-12

最新推荐文章于 2024-09-07 23:36:56 发布

拼。

最新推荐文章于 2024-09-07 23:36:56 发布

阅读量172

点赞数

文章标签：大数据特征值分解

原文链接：https://medium.com/fintechexplained/what-are-eigenvalues-and-eigenvectors-a-must-know-concept-for-machine-learning-80d0fd330e47

版权

什么是特征值和特征向量？
原文链接：https://medium.com/fintechexplained/what-are-eigenvalues-and-eigenvectors-a-must-know-concept-for-machine-learning-80d0fd330e47
特征向量和特征值是数据科学领域的核心。本文旨在解释什么是特征向量和特征值，它们是如何计算的以及我们如何使用它们。对于任何想要深入了解机器学习的人来说，这是一个必须知道的话题。特征值和特征向量构成了计算和数学的基础。它们被科学家大量使用。
文章结构本文分为六个部分：

我将首先简要介绍特征向量和特征值。
然后我将说明它们的用例和应用程序。
然后，我将解释构成特征值和特征向量的构建块，例如矩阵加法和乘法的基础知识，以便我们可以更新知识并彻底理解概念。
.特征向量和特征值介绍在我们深入研究计算特征向量和特征值之前，让我们了解它们的真正含义。让我们考虑一下我们想要构建数学模型（方程），其中输入数据是从大量来源收集的。
例如，假设我们要预测一个复杂的金融变量，例如利率随时间的变化。让我们将利率称为 y。第一步可能涉及找到 y 依赖的变量。让我们将这些变量称为x(i)我们将通过收集y所依赖的变量的数据来开始我们的研究。一些数据可能是文本格式。任务是将非数字数据转换为数字数据。
例如，我们经常使用单热编码将文本特征中的值转换为分隔数字列。如果我们的输入数据是图像格式，那么我们必须以某种方式将图像转换为数字矩阵。第二步是将数据连接成表格格式，其中表格的每一列都由 1 个或多个特征计算。这将导致一个大的稀疏矩阵（表）。有时，它可以将我们的维度空间增加到 100 多列。现在让我们明白这一点！它引入了自己的一系列问题，
例如大型稀疏矩阵最终会占用大量磁盘空间。此外，模型在数据上进行自我训练变得非常耗时。此外，超过 3 维的数据很难理解和可视化，更不用说超过 100 维的数据集了。因此，以某种方式将此数据压缩/转换为较小的数据集将是理想的。
有一个解决方案。我们可以利用特征值和特征向量来减少维度空间。详细地说，提高计算密集型任务效率的关键方法之一是在确保保留大部分关键信息后降低维度。特征值和特征向量是在这些场景中使用的关键工具
1.1 什么是特征向量？
我想用我们容易理解的方式来解释这个概念。为简单起见，让我们假设我们生活在二维世界中。
Alex 的房子位于坐标 [10,10]（x=10 和 y =10）。我们将其称为向量 A。
此外，他的朋友 Bob 住在坐标为 [20,20]（x=20 和 y=20）的房子里。我将其称为向量 B。
如果亚历克斯想在他的地方与鲍勃会面，那么亚历克斯必须在 x 轴上移动 +10 点，在 y 轴上移动 +10 点。这种运动和方向可以表示为二维向量 [10,10]。我们将其称为向量 C。
我们可以看到向量 A 到 B 是相关的，因为向量 B 可以通过将向量 A 缩放（乘以）2 来实现。这是因为 2 x [10,10] = [20,20]。这是鲍勃的地址。向量 C 也代表 A 到达 B 的运动。
需要注意的关键是矢量可以包含运动的幅度和方向。到现在为止还挺好！我们从上面的介绍中了解到，大量数据可以表示为矩阵，我们需要以某种方式压缩稀疏矩阵的列以加快计算速度。另外，如果我们将矩阵乘以一个向量，那么我们就会得到一个新的向量。矩阵乘以向量被称为变换矩阵。我们可以通过将矩阵与向量相乘来将矩阵转换和改变为新的向量。
矩阵乘以一个向量计算一个新的向量。这是转换后的向量。暂时保留这个想法！可以认为新向量有两种形式：
有时，新的变换向量只是原始向量的缩放形式。这意味着可以通过简单地将标量（数字）乘以原始向量来重新计算新向量；就像上面向量 A 和 B 的例子一样。
其他时候，变换后的向量与我们用来乘以矩阵的原始向量没有直接的标量关系。如果新的变换向量只是原始向量的缩放形式，那么原始向量就是原始矩阵的特征向量。具有这种特征的向量是特殊向量，它们被称为特征向量。特征向量可用于表示大维矩阵。
因此，如果我们的输入是一个大的稀疏矩阵 M，那么我们可以找到一个可以替换矩阵 M 的向量 o。标准是矩阵 M 和向量 o 的乘积应该是向量 o 和标量 n 的乘积：M * o = n* o这意味着矩阵 M 和向量 o 可以替换为标量 n 和向量 o。
在这种情况下，o 是特征向量，n 是特征值，我们的目标是找到 o 和 n。因此，特征向量是一个在对其应用变换时不会改变的向量，只是它变成了原始向量的缩放版本。特征向量可以帮助我们将大矩阵的近似值计算为较小的向量。
还有许多其他用途，我将在本
List item

文后面解释。特征向量用于使线性变换易于理解。将特征向量视为在不改变方向的情况下拉伸/压缩 XY 折线图。
1.2 什么是特征值？
特征值- 用于变换（拉伸）特征向量的标量。让我们了解在哪里使用特征值和特征向量
2.特征向量和特征值在哪里使用？
1.特征值和特征向量有多种用途：特征值和特征向量在线性微分方程中很重要，在这些方程中您要找到变化率或要保持两个变量之间的关系。将特征值和特征向量视为提供大型矩阵的摘要

我们可以用矩阵表示大量信息。
在大型矩阵上执行计算是一个非常缓慢的过程。详细地说，提高计算密集型任务效率的关键方法之一是在确保保留大部分关键信息后降低维度。因此，使用一个特征值和特征向量来捕获存储在大矩阵中的关键信息。该技术还可用于提高数据搅动组件的性能。
成分分析是在不丢失有价值信息的情况下减少维度空间的关键策略之一。分量分析 (PCA) 的核心建立在特征值和特征向量的概念之上。该概念围绕计算特征协方差矩阵的特征向量和特征值。
此外，特征向量和特征值用于面部识别技术，例如 EigenFaces。
它们用于减少维度空间。特征向量和特征值技术用于压缩数据。如上所述，PCA 等许多算法都依赖于特征值和特征向量来降维。特征值也用于正则化，它们可用于防止过度拟合。特征向量和特征值用于减少数据中的噪声。它们可以帮助我们提高计算密集型任务的效率。它们还消除了它们之间具有强相关性的特征，还有助于减少过度拟合。
有时我们会收集包含大量噪音的数据。在数据中找到重要或有意义的模式可能非常困难。特征向量和特征值可用于构建谱聚类。它们也用于奇异值分解。
我们还可以使用特征向量对数据集中的项目进行排名。它们在搜索引擎和微积分中被大量使用。8
最后，在非线性运动动力学中，特征值和特征向量可用于帮助我们更好地理解数据，因为它们可用于将数据转换和表示为可管理的集合。
话虽如此，计算特征向量和特征值可能很慢。计算是 O(n³)照片由Helloquence在Unsplash上拍摄现在很明显，特征值和特征向量是数据科学中需要理解的核心概念之一。

拼。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-08-12

什么是特征值和特征向量？原文链接：https://medium.com/fintechexplained/what-are-eigenvalues-and-eigenvectors-a-must-know-concept-for-machine-learning-80d0fd330e47特征向量和特征值是数据科学领域的核心。本文旨在解释什么是特征向量和特征值，它们是如何计算的以及我们如何使用它们。对于任何想要深入了解机器学习的人来说，这是一个必须知道的话题。特征值和特征向量构成了计算和数学的基础。它们被
复制链接

扫一扫