java实现pca算法_PCA算法原理与实现

最新推荐文章于 2024-04-26 23:33:18 发布

杏坛小子

最新推荐文章于 2024-04-26 23:33:18 发布

阅读量769

点赞数

文章标签： java实现pca算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28885435/article/details/114356339

版权

本文主要基于同名的两篇外文参考文献A Tutorial on Principal Component Analysis。

PCA，亦即主成分分析，主要用于对特征进行降维。如果数据的特征数非常多，我们可以认为其中只有一部分特征是真正我们感兴趣和有意义的，而其他特征或者是噪音，或者和别的特征有冗余。从所有的特征中找出有意义的特征的过程就是降维，而PCA是降维的两个主要方法之一(另一个是LDA).

Jonathon Shlens的论文中举了一个物理学中测试理想情况下弹簧振动的例子，非常生动，详见[1](中文翻译见[5])。

我们首先看一下给定一个代表数据记录的矩阵A，如果计算其主成分P，并如何利用P得到降维后的数据矩阵B，然后介绍一下这个计算过程背后的原理，最后会有在Python中实现PCA和在Weka中调用PCA算法的实例。

1. 计算过程：

假设我们有n条数据记录，每条记录都是m维，我们可以把这些数据记录表示成一个n*m矩阵A。

对矩阵A的每一列，求出其平均值，对于A中的每一个元素，减去该元素所在列的平均值，得到一个新的矩阵B。

计算矩阵Z=BTB/(n-1)。其实m*m维矩阵Z就是A矩阵的协方差矩阵。

计算矩阵Z的特征值D和特征向量V,其中D是1*m矩阵，V是一个m*m矩阵，D中的每个元素都是Z的特征值，V中的第i列是第i个特征值对应的特征向量。

下面，就可以进行降维了，假设我们需要把数据由m维降到k维，则我们只需要从D中挑选出k个最大的特征向量，然后从V中挑选出k个相应的特征向量，组成一个新的m*k矩阵N。

N中的每一列就是A的主成分(Pr

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java实现pca算法_PCA算法原理与实现

本文主要基于同名的两篇外文参考文献A Tutorial on Principal Component Analysis。PCA，亦即主成分分析，主要用于对特征进行降维。如果数据的特征数非常多，我们可以认为其中只有一部分特征是真正我们感兴趣和有意义的，而其他特征或者是噪音，或者和别的特征有冗余。从所有的特征中找出有意义的特征的过程就是降维，而PCA是降维的两个主要方法之一(另一个是LDA).Jona...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。