主成分分析(PCA)

PCA是一种数据降维方法,通过找到最佳坐标系(主成分)来最大化数据的方差。它涉及数据的线性变换,包括拉伸和旋转,以使数据在新坐标轴上分散。协方差矩阵和特征向量在PCA的计算中起到关键作用,而SVD提供了与PCA密切相关的矩阵分解。PCA的主要目标是保持数据的信息量,同时减少维度。
摘要由CSDN通过智能技术生成

目录

引子

PCA是什么?

好坐标系的评价标准

实现PCA的步骤

数据线性变换

拉伸

 旋转​编辑

白数据-->自己的数据

自己的数据--> 白数据

如何求R

协方差矩阵

协方差的特征向量

PCA求解步骤

PCA——3维降到2维

PCA与SVD


数据降维的算法!

引子

 PCA是什么?

答:找坐标系!

 

 

注意:要找到从一个坐标系到另一个坐标系的旋转角度和平移,使得在原始坐标系中得数据投影到新的坐标系上的数据要分散开!若是投影到新的坐标轴上的数据集中在一块的话,说明原始坐标系中的信息,没有被完全保留下来!

好坐标系的评价标准

 新坐标系的第一个维度叫做主成分1,第二个维度叫做主成分2!

实现PCA的步骤

数据线性变换

拉伸

 旋转

 白数据-->自己的数据

 

 注意:拉伸决定了方差最大的方向是横或者纵;旋转决定了方差最大的方向的角度!

立即推:就是要找到旋转的角度R,找到R后再进行拉伸,就可以找到最好的坐标系!

自己的数据--> 白数据

 

 如何求R

 

 协方差矩阵

 

 注意:左边第一个图是两个轴的数据是独立的,中间的图两个轴是正相关的,第三张图两个轴是负相关的!

 

 

 协方差的特征向量

 

 

 

 

 

 PCA求解步骤

 PCA——3维降到2维

 

 

 PCA与SVD

 注意:SVD中的V矩阵就是PCA的主成分,即使旋转矩阵R!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值