PCA主成分分析简单理解

PCA:主成分分析


可以这样简单理解,假设原先在H维坐标空间有N个点,那么我们想要做的事情是,寻找一个新的比原先维数低(假设为L)的坐标空间,使得这N个点的主要信息(也就是方差,或者说成能量)在这个新的空间里能够保留下来。举个例子,新的低维坐标空间里面的坐标轴为Y1,Y2,...,YL.在PCA里面,我们称Y1为第一主分量,也就是说Y1能够包含N个点在原先的高维度空间里面的大部分信息(可以这样想,原先的N个点投影到这个Y1坐标轴上,它们之间的方差是最大的,它们在这个新的坐标轴上损失的信息较少,反之,如果这些点投影到这个坐标轴上后之间的方差很小,可以想象成混在了一起,也就是无法进行区分,相当于原先的信息根本无法保留下来,那么这个就不是一个好的新坐标轴)。


为了达到尽可能保留原先点的信息,使得这L个新坐标足以表达原先点的主要信息,Y1,Y2,...,YL依次为第一主分量,第二主分量,...,第L主分量,而且这些坐标轴是互不干扰的,也就是说各自保留主要信息。那么也就是需要Energy(Y1)>Energy(Y2)>...>Energy(YL),同时Yi和Yj协方差为0(也就是没有相关性),那么,我们的数学目标就是:

假设新的坐标是:Y=[Y1,Y2,...,YL],求其协方差矩阵Y*Y'(表示转置)=B,B是一个对角矩阵,它的对角线上的元素从左上角到右下角依次降低(对应Y1到YL能量依次下降),而其他元素为0表示各不相干。


在R语言中,进行主成分分析PCA)有多种方法可以使用。其中一种常用的方法是使用prcomp()和princomp()函数。这两个函数都可以直接输入数据并输出结果,实现简单方便。 另外,如果你想更深入地了解PCA的原理,可以参考一些详细的说明文档和教程。例如,可以查阅https://blog.csdn.net/LuohenYJ/article/details/78355954,这个链接提供了关于PCA原理的详细说明。 总结来说,在R语言中进行PCA主成分分析,你可以使用prcomp()和princomp()函数来直接得到结果,也可以通过自编函数的方式进行学习和理解PCA的原理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [[R语言] R语言PCA分析教程 Principal Component Methods in R](https://blog.csdn.net/LuohenYJ/article/details/97950522)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [R语言如何实现主成分分析PCA),最全详细教材](https://blog.csdn.net/xj4math/article/details/115445490)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值