直观上理解PCA中特征值和特征向量

PCA(主成分分析)是数据分析中的一种重要技术,它通过找到数据的最大方差方向来降低维度。在PCA中,特征值反映了不同特征维度上的样本分布差异,特征向量指示了这些差异的主要方向。直观理解特征值和特征向量,可以考虑当样本在多个特征上的分布相同时,哪个特征的投影值差异最大,那个特征就对应较大的特征值,其对应的特征向量则揭示了数据的主要变化趋势。
摘要由CSDN通过智能技术生成
很多人都了解PCA算法,但是总很难直观上去想象和理解整个过程,特别是为什么特征向量可以作为一个PCA特征空间变换后的一个基?特征向量和特征值到底怎么理解?

也许很多人查了很多文章和书籍,但是它们几乎没有直面回答。就连解释特征向量和特征值也都是搬特征值分解公式:(XX^T)w=lambda*w。这种解释是苍白无力的,我们依然不能直观理解特征向量和特征值。也有文章将XX^T当做变换矩阵,并从特征向量w的缩放上试图说明,然而依然不能解释透彻(就我而言),更难回答第一个问题“为什么特征向量可以作为一个PCA特征空间变换后的一个基?”

下面的解释过程不是很严谨,反过来却适合直观上去找找感觉。首先我先列个思路:
1.协方差矩阵表示什么?
2.特征向量为什么能表示协方差矩阵特性?特点?
3.扣住常识的特征值分解公式,把故事说圆
4.特征向量为什么能作为PCA变换后特征空间的一个基?
5.特征值部分扣住第四点 <
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值