7. 主成分分析 PCA

最新推荐文章于 2022-06-06 15:22:21 发布

n不正

最新推荐文章于 2022-06-06 15:22:21 发布

阅读量587

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30981697/article/details/71545543

版权

主成分分析PCA是一种非监督学习的特征降维方法，常用于深度学习的特征提取。PCA通过找到数据最大方差的方向进行降维，保证新特征的线性组合。本文介绍了PCA降维的原因、原理、公式推导以及问题求解过程。

摘要由CSDN通过智能技术生成

7. 主成分分析 PCA

pdf版本下载：https://pan.baidu.com/s/1bKDYAa
html版本下载：https://pan.baidu.com/s/1o7H7DsI

主成分分析（Principal Component Analysis）属于非监督学习，是特征降维中最老牌的算法之一，应用十分广泛。特别是在现在深度学习进行特向特征提取的过程中，往往由于原始特征过于复杂需要进行降维处理。

1 降维的原因

原因：
- 1.使得数据更容易显示，更容易理解
- 2.降低算法的计算开销
- 3.去除噪声
PCA的过程就是将高维的数据投影到较低维的空间上，所以它不同于特征选择，通过PCA提取得到的特征是原始特征的线性组合。而其中的提取规则如下

2 PCA降维原理

此处输入图片的描述

在信号处理中认为信号具有较大的方差，噪声有较小的方差，信噪比就是信号与噪声的方差比，越大越好。例如上面的图中，我们需要把二维平面上的数据点降到一维，显然数据点在 $u_1$ 方向上的投影方差较大，因此对所有的数据点具有较好的区分效果。所以，一般地，当我们需要把n维的数据降维降到k维时，就需要数据在这k维上都具有较好的区分度（较大的方差）。

假设数据集： $D = \{x_1,x_2,..,x_m\}$ ，每个数据的维数 $d$
假设需要降低到 $k$ 维。
步骤：
- 1.对所有数据中心化： $x_i \leftarrow x_i - \frac{1}{m}\sum\limits_{t=1}^{m}x_t$
- 2.计算样本的协方差矩阵： $XX^T$
- 3.对 $XX^T$ 做特征值分解
- 4.取最大的k个特征值所对应的k个特征向量 $w_1,..w_k$
- 5.输出投影矩阵 $W= (w_1,..,w_k)$
最后，这里的 $k$ 如何确定呢？可以预先指定一个降维的主成分比例，即得到的k维数据满足：

∑i=1kλi∑i=1nλi≥t∈(0,1] $\frac{\sum\limits_{i=1}^{k} \lambda_i}{\sum\limits_{i=1}^{n} \lambda_i} \geq t \in (0, 1]$

3 公式推导

最近重构性：样本点到这个超平面的距离都足够近。
- 假设数据 { x1<

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。