特征值和特征向量意义

最新推荐文章于 2021-12-21 17:09:18 发布

sdf57

最新推荐文章于 2021-12-21 17:09:18 发布

阅读量393

点赞数

分类专栏：数学

原文链接：https://blog.csdn.net/zhinanpolang/article/details/84991545

版权

数学专栏收录该内容

10 篇文章 0 订阅

订阅专栏

首先我们先把特征值和特征向量的定义复习一下：

定义：设A是n阶矩阵，如果数λ和n维非零向量x使关系式

……(1)

成立，那么，这样的数λ称为矩阵A的特征值，非零向量x称为A的对应于特征值λ的特征向量，（1）式还可以写为：

……（2）

如果想求出矩阵对应的特征值和特征向量就是求式（2）的解了。

那么，问题来了，这个式子要怎么理解呢？

首先得先弄清矩阵的概念:一个矩阵代表的是一个线性变换规则，而一个矩阵的乘法运行代表的是一个变换;

比如有一个矩阵A：

一个列向量为X为：

一个矩阵的乘法为：

向量X通过矩阵A这个变化规则就可以变换为向量Y了

在几何上的变换就类似于这样：

知道了这个就可以从几何上理解特征值和特征向量是什么意思了，由

可知:

所以，确定了特征值之后，向量x的变换为：

引用《线性代数的几何意义》的描述：“矩阵乘法对应了一个变换，是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中，原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换，不对这些向量产生旋转的效果，那么这些向量就称为这个矩阵的特征向量，伸缩的比例就是特征值。”

那么这样定义的特征值和特征向量有什么实际用途呢?在这里我举个数据挖掘算法中重要的一个算法：PCA（主成分分析）来给大家直观的感受一下。

首先，理解一下信息量这个概念

看几张图：

如果我们单独看某一个维度的话，比如看x1这个维度

可以看到将点投影到x1这个维度上看的话，图1的数据离散性最高，图3较低，图2数据离散性是最低的。数据离散性越大，代表数据在所投影的维度上具有越高的区分度，这个区分度就是信息量。如果我们用方差来形容数据的离散性的话，就是数据方差越大，表示数据的区分度越高，也就是蕴含的信息量是越大的。

基于这个知识，如果我们想对数据进行降维的话，比如图1的两个维度的数据降成一维，我们可以选择保留X1这个维度的数据，因为在这个维度上蕴含的信息量更多。

同理，图2就可以保留x2这个维度的数据。但是，问题来了，图3应该保留哪个维度的数据呢？答案是保留哪个维度都不好，都会丢失较大的信息量。但是，如果我们把图3的坐标轴旋转一下

比较容易看出，图3在新的坐标轴下就能进行降维了。所以选取正确的坐标轴，然后根据各个维度上的数据方差大小，决定保留哪些维度的数据，这样的做法就是主成分分析的核心思想。

选取正确的坐标轴的过程中，我们需要一个矩阵变换，就类似于这样：

也就是：

其实，经过数学上的推导的，我们就可以知道，特征值对应的特征向量就是理想中想取得正确的坐标轴，而特征值就等于数据在旋转之后的坐标上对应维度上的方差。

也就是说，直接求出矩阵A的特征向量得出对应的特征向量。我们就能找到旋转后正确的坐标轴。这个就是特征值和特征向量的一个实际应用：“得出使数据在各个维度区分度达到最大的坐标轴。”

所以，在数据挖掘中，就会直接用特征值来描述对应特征向量方向上包含的信息量，而某一特征值除以所有特征值的和的值就为：该特征向量的方差贡献率（方差贡献率代表了该维度下蕴含的信息量的比例）。

通常经过特征向量变换下的数据被称为变量的主成分，当前m个主成分累计的方差贡献率达到一个较高的百分数（如85%以上）的话，就保留着这m个主成分的数据。实现了对数据进行降维的目的。整个主成分分析的算法原理也就是这个。

总结：

1.如果矩阵对某一个向量或某些向量只发生伸缩变换，不对这些向量产生旋转的效果，那么这些向量就称为这个矩阵的特征向量，伸缩的比例就是特征值；

2.特征向量在一个矩阵的作用下作伸缩运动，伸缩的幅度由特征值确定；

3.特征向量不改变方向，改变的只是特征值

4.特征向量：不是一个向量而是一个向量族

特征值：反映了特征向量在变换时的伸缩倍数而已

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sdf57 CSDN认证博客专家 CSDN认证企业博客

码龄10年

9: 原创

17万+: 周排名

182万+: 总排名

23万+: 访问

: 等级

856: 积分

58: 粉丝

189: 获赞

9: 评论

962: 收藏

私信

关注

热门文章

分类专栏

最新评论

旅行商问题（动态规划方法，超级详细的）
2301_77658419: 这个代码能截图吗
标准论文参考文献添加方法——Zotero入门使用教程
Eric要努力: 博主您好，如何进行自动的编号呢？非常感谢
一个专门下载全球气象站数据的网站（包括中国700多个站）
羲和能源气象大数据平台: 分享一些我常用的气象数据网站中国气象局 https://www.cma.gov.cn/ 作为全国气象工作的政府行政管理职能，负责全国气象工作，主要履行公共气象服务以及气象防灾减灾、应对气候变化、开发利用气候资源、人工影响天气等业务、服务管理等职能。提供权威气象政务信息、天气预报、气象预警、气候变化、防灾减灾、气象科普等权威官方信息。羲和能源气象大数据平台 https://xihe-energy.com/ 提供全球任意单点位置或地域平均统计的历史40年至未来7日的11种气象小时级数据，及以此为基准生成的风电、光伏发电功率数据。同时还可以提供多种地理信息数据和260余种更多属性数据。通过对数据的处理分析计算，还提供地区新能源资源分析、光伏倾角优化、光伏电站系统方案设计及项目建议书一键生成等功能。国家气象信息中心 http://data.cma.cn/ 承担着全球观测基础数据和气象产品的收集分发、气象数据加工处理与归档管理、气象数据产品研发与服务、高性能计算资源调度与并行计算技术支持、气象电子政务技术支持、信息系统基础设施资源管理与服务、信息网络安全防护及业务运行保障等任务职责。国家气候中心 http://ncc.cma.gov.cn/cn/ 国家气候中心承担着国家级气候和气候变化监测、预测、影响评估业务、服务和科研任务，坚持面向国家需求和国际科技前沿，为气象防灾减灾、应对气候变化和生态文明建设提供全方位、多层次、精细化的高质量服务。 NASA https://www.nasa.gov/ 美国航空航天局（英语：National Aeronautics and Space Administration，简称NASA），又称美国宇航局、美国太空总署，是美国联邦政府的一个行政性科研机构，负责制定、实施美国的太空计划，并开展航空科学暨太空科学的研究。NASA是世界上最权威的航空航天科研机构，与许多国内及国际上的科研机构分享其研究数据。欧洲中尺度天气预报中心 http://www.ecmwf.int 包括34个国家支持的国际性组织，是当今全球独树一帜的国际性天气预报研究和业务机构。其前身为欧洲的一个科学与技术合作项目。1975年ECMWF正式成立，总部设在英国的Bracknell。
回声状态网络(ESN)原理详解(附源码实现)
释瞳: 您好，请问一下储备池到输出层的连接为Wout(L*(K+N+L)阶)这个阶数是怎么确定的。能解释一下吗，谢谢
分位数回归（Quantile Regression）
AscendToTop: 分位数直接求不就行了？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。