PCA(Principal Components Analysis)

最新推荐文章于 2024-05-18 22:41:35 发布

easywaytolifebelief

最新推荐文章于 2024-05-18 22:41:35 发布

阅读量290

点赞数

文章标签： machine learning -pca

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/easywaytolifebelief/article/details/58608089

版权

1、算法步骤

1）数据预处理---数据归一化处理

1-2步使得数据集的均值为0，3-4步将每个方差重新调整到单位方差。保证数据不同属性的数据规模相同。如果不同属性的数据规模相同，3-4步可以忽略。

2）在均值归一化和可选的特征scaling后

2、数学上的理解

我们想要将数据降维，例如从将某个向量从n维降到k维，我们需要找到一个空间中的k个方向，使得该向量投影到这k个方向上的值的方差到达最大，这就尽最大的能力保留了数据的方差（也可以理解为信息尽可能不被覆盖，或者数据点之间距离尽可能远）。

假设u是一个1个方向，则x ⁽ⁱ⁾在u上的投影就是x(i)与u的内积，即(x ⁽ⁱ⁾) ^T*u，则使得投影后的x' ⁽ⁱ⁾的方差最大，因为均值归一化后，均值为0，所以有一下的公式：

其中中间的方阵是x的协方差矩阵（x均值已归为0），要想使上如较大，||u ^T∑u||最大，由于∑u = λu，u是∑的特征值是λ时的特征向量。当||u ^Tu|| = 1时（标准正交），则λ较大时x变换后的方差最大，此时u为λ较大时对应的特征向量，当要求一个k维的基底时，u则取前k个较大的λ对应的特征向量。

具体求解的时候用到奇异值分解，matlab或python中提供了相应的函数，svd()。该分解得到三个矩阵（u，s ，v），其中u的前k列即为所求的基底（投影方向），是标准正交的。

至于为什么前k个就是前k个较大的λ对应的特征向量，接下来会有一章内容讲解奇异值分解。

参考： http://blog.codinglabs.org/articles/pca-tutorial.html

easywaytolifebelief

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。