利用PCA进行数据降维

PCA(主成分分析)是一种常用的数据降维方法。本文介绍了PCA的基本原理,包括特征值和特征向量的计算,以及与奇异值分解(SVD)的区别。实践部分展示了PCA在新冠确诊数据上的应用,通过不同数量的主成分重建数据,揭示PCA在高维数据集降维上的有效性。然而,PCA可能导致数据可解释性的丧失,需权衡降维与可解释性的关系。
摘要由CSDN通过智能技术生成

PCA原理


在介绍PCA之前首先要熟悉一下数学推导过程。

特征多项式:

设A为一个方阵,则该方阵的特征多项式就为该方阵减去\lambda倍的单位矩阵后构成的矩阵的行列式。而该多项式的所有解即为\lambda的值,也就是该方阵的特征值。

解得特征值之后如何求得特征向量:

找到特征值后,根据上式定义我们可推出Ax-\lambda x=0,即(A-\lambda )x=0,该式中x即为特征向量,A\lambda已知,解出上式即可求出方阵A的特征向量,且每个特征值\lambda对应一个特征向量。

特征分解:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值