非监督学习算法——PCA算法

最新推荐文章于 2024-06-01 16:43:19 发布

Taiiiii

最新推荐文章于 2024-06-01 16:43:19 发布

阅读量690

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Taiiiii/article/details/105820859

版权

PCA算法主要用于数据降维，如用于数据压缩、可视化和异常值检测。它寻找方差最大的方向作为主成分，使得在保留数据信息的同时降低维度。PCA通过将数据映射到新的坐标系来实现这一目标，可以使用sklearn库或者手动实现。

摘要由CSDN通过智能技术生成

文章目录

PCA算法
sklearn 调用PCA算法
手打python实现简单PCA算法

PCA算法

作用

pca算法主要用于数据的降维，可以发现更便于人来理解的特征。还可以可视化，去噪。

数据降维的作用：

数据压缩
做数据可视化或特征提取（比如降到2维，看坐标图可视化）
异常值检测和聚类

优缺点

精度上可能稍微会有所丢失，但是速度上会提高

工作原理

工作原理：PCA找主成分的时候其实在寻找K个尽可能的把样本区分开方向，即方差尽可能大的方向作为主成分，这样就可以做到在保留尽可能多的数据信息的情况下把数据的维度降到了K维（原来肯定是比K维大）
所以，主成分的标准两个条件，一是互不相关，二是用来描述数据的时候，方差尽可能大。
在这里插入图片描述

数学公式

计算公式：

方差函数：
样本均值归为0：
$\operatorname{Var}(x)=\frac{1}{m} \sum_{i=1}^{m} x_{i}^{2}$
二维：
$\operatorname{Var}\left(X_{\text {project}}\right)=\frac{1}{m} \sum_{i=1}^{m}\left(X^{(i)} \cdot w\right)^{2}$
N维：
$\operatorname{Var}\left(X_{\text {project}}\right)=\frac{1}{m} \sum_{i=1}^{m}\left(X_{1}^{(i)} w_{1}+X_{2}^{(i)} w_{2}+\ldots+X_{n}^{(i)} w_{n}\right)^{2}$

最低0.47元/天解锁文章

Taiiiii

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
非监督学习算法——PCA算法

文章目录PCA算法作用优缺点工作原理数学公式sklearn 调用PCA算法手打python实现简单PCA算法PCA算法作用pca算法主要用于数据的降维，可以发现更便于人来理解的特征。还可以可视化，去噪。数据降维的作用：数据压缩做数据可视化或特征提取（比如降到2维，看坐标图可视化）异常值检测和聚类优缺点精度上可能稍微会有所丢失，但是速度上会提高工作原理工作原理：PCA找主成...
复制链接

扫一扫

专栏目录