PCA降维全过程

最新推荐文章于 2024-07-20 17:25:24 发布

Deepin_L

最新推荐文章于 2024-07-20 17:25:24 发布

阅读量1.8k

点赞数 2

分类专栏：机器学习文章标签： pca降维机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Deepin_L/article/details/109401021

版权

PCA（主成分分析）是一种常见的降维方法，通过找到数据的主成分来降低数据维度，同时保留大部分信息。PCA首先对数据进行中心化，然后计算协方差矩阵并求解其特征值和特征向量。最大的特征值对应的方向是数据投影后方差最大的方向，以此为基础可以选择前k个最大特征值对应的特征向量，从而将d维数据降维到k维。PCA流程包括数据预处理、协方差矩阵计算、特征值与特征向量求解、选择主成分以及数据降维。

摘要由CSDN通过智能技术生成

PCA的目的

将原有的d维数据集，转换成k维的数据（k<d）
新生成的k维数据尽可能的包含原来d维数据的信息

PCA的数学推导

假设对n个样本 $x_i$ 进行PCA处理，先对数据进行中心化，即将数据的均值变为0（为了后面计算的方便，不用减去mean）
$\frac{1}{N}\sum_{i=1}^{N}x_i=0$
则数据集的协方差矩阵为
$Cov(x_i,x_j)=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu_i)(x_j-\mu_j) \\$
由于上面已经将数据中心化 $\mu_i,\mu_j$ 均为0，所以这里的协方差可以简化为下面的式子
$Cov(x_i,x_j) = \frac{1}{n}\sum_{i,j=1}^{n}x_i^Tx_j$

最低0.47元/天解锁文章

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Deepin_L CSDN认证博客专家 CSDN认证企业博客

码龄6年

12: 原创

21万+: 周排名

227万+: 总排名

1万+: 访问

: 等级

249: 积分

4: 粉丝

14: 获赞

3: 评论

82: 收藏

私信

关注

热门文章

分类专栏

最新评论

Matplotlib可视化--散点图（笔记）
wfy0828: File "<ipython-input-29-5dcd337ecfce>", line 2 midwest = pd.read_csv("C:\Users\sherlock\Downloads\全国消费品交易情况文件180621124\CME_Dtrade3.xlsx") ^ SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape 这个怎么解决呀
PCA降维全过程
huiyin1314: 写的不错
DataWhale数据挖掘-Task3笔记
ctotalk: very good
LDA降维的讲解
不正经的kimol君: 大神解释得很详细，点赞

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。