主成分分析（PCA）

最新推荐文章于 2024-08-11 23:49:39 发布

酸柠檬水

最新推荐文章于 2024-08-11 23:49:39 发布

阅读量396

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zr7116/article/details/91304235

版权

机器学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

预处理数据的方法总结（使用sklearn-preprocessing）： https://blog.csdn.net/sinat_33761963/article/details/53433799

向量点乘（内积）和叉乘（外积、向量积）概念及几何意义解读：https://blog.csdn.net/dcrmg/article/details/52416832

主成分分析（PCA）原理详解：http://blog.csdn.net/zhongkelee/article/details/44064401

最大方差理论
在信号处理中认为信号具有较大的方差，噪声有较小的方差，信噪比就是信号与噪声的方差比，越大越好。如前面的图，样本在u1上的投影方差较大，在u2上的投影方差较小，那么可认为u2上的投影是由噪声引起的。

因此我们认为，最好的k维特征是将n维样本点转换为k维后，每一维上的样本方差都很大。

比如我们将下图中的5个点投影到某一维上，这里用一条过原点的直线表示（数据已经中心化）：

假设我们选择两条不同的直线做投影，那么左右两条中哪个好呢？根据我们之前的方差最大化理论，左边的好，因为投影后的样本点之间方差最大（也可以说是投影的绝对值之和最大）。

计算投影的方法见下图5：

图中，红色点表示样例，蓝色点表示在u上的投影，u是直线的斜率也是直线的方向向量，而且是单位向量。蓝色点是在u上的投影点，离原点的距离是<x,u>（即xTu或者uTx）。

==》使样本的每个维度均值都是0

==》此处的x是已经-x 均值的 x xi已经映射到了新的坐标轴轴是斜的

=》使得映射后的样本方差最大

==》技巧谁相加把谁拆开

推导的过程中一定要注意：

谁是矩阵谁是向量

向量的化是行向量还是列向量

矩阵的话几行几列样本在行还是在列

==》改进取多个主成分

把数据中第一主成分减去数据中剩的是除了第一主成分以外的成分

高维==》低维

低维==》高维

维度与数据留存百分比可控 ==》不知道取多少主成分但要保证95%以上的方差

从n_components 中看到要保存95%方差的信息要取 28个主成分

（手写识别字一共64个特征对原始数据进行降维后再进行分类）

降维后精度会有减小时间也会减小可以控制一定的数据量

数据去燥：

将二维数据取第一个重要维度将数据降维

再将降维的数据转为原来维度的数据此时损失的数据即为噪声数据

每一行w 在人脸识别中代表特征脸

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

酸柠檬水 CSDN认证博客专家 CSDN认证企业博客

码龄6年

107: 原创

6万+: 周排名

136万+: 总排名

12万+: 访问

: 等级

2185: 积分

15: 粉丝

35: 获赞

5: 评论

185: 收藏

私信

关注

热门文章

分类专栏

深度学习 17篇
机器学习 24篇
python 20篇

最新评论

KD树 Java实现
_yyykkk_: 看代码是从0维开始划分，缺少了通过求每个维度的方差，确定维度划分顺序的逻辑吧？
线性表之顺序表链表
CSDN-Ada助手: 你的文章质量不错，值得学习！但还有一点小瑕疵，具体如下：(1)使用标准目录；(2)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(3)使用更多的站内链接。
KD树 Java实现
2018wl: 我在大佬的评论区瑟瑟发抖,欢迎大佬回访我的博客
KD树 Java实现
Mr_circleT: 你好，问一下，有的区间进行查询时，会报一个空指针异常的错，不知道是为什么。。。。比如，给出代码的main中测试，查询[4,3]的近邻域，就会报错

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。