PCA原理总结

最新推荐文章于 2024-08-11 23:49:39 发布

TX951

最新推荐文章于 2024-08-11 23:49:39 发布

阅读量1.1k

点赞数 1

分类专栏：基础知识数学统计文章标签： PCA 主成分分析机器学习降维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TX951/article/details/53365570

版权

本文介绍了PCA（主成分分析）的基本原理，从降维的动机出发，解释了如何通过基变换实现数据的降维。PCA的目标是找到一组正交基，使得投影后的数据方差最大且各维度间不相关。文章详细讨论了协方差矩阵在PCA中的作用，以及如何通过最大化方差和保持基向量正交来选择最优基。PCA适用于处理线性相关性的高维数据，但对高阶相关性有限制。文章还提到了kernel PCA作为解决非线性相关问题的方法。PCA的一大优点是结果稳定，但灵活性不足，无法进行个性化优化。

摘要由CSDN通过智能技术生成

本来打算查查资料总结一下PCA的原理，但是发现关于PCA介绍的神文一篇，颇有深入浅出的感觉，介绍的实在详细，我还是不献丑了。但是，单纯转载过来实在没什么技术性，而且也有点辜负当初那位大神的费心总结，所以认真拜读之后，整理原文介绍PCA的思路如下，希望能够锦上添花，方便读者理解。原文地址：点击打开链接

1. 先说明数据的维度可能是彼此相关的，当维度很高时，是否可以降维，并且使得信息的损失最小。在这里作者举例男女性别以及销售情况，来说明降维的动机和可行性。

2. 解释 向量內积的物理含义，即，当向量B的模为1时，向量A和向量B的內积等于向量A在B所在直线上的投影的矢量距离。注：矢量距离可为负，此时两向量夹角为钝角；标量距离只能为正。

3. 引入基的定义，以及当基向量变化时，新的坐标就是原向量在新的基向量上的投影，即矢量距离，也就是原向量和单位基向量的內积。注：基的确定，是一切向量坐标定位的前提。另外点明，只要不是在一条直线上的两向量，都可以成为一组基向量，但是一般希望是正交的。

4.推广单个向量在二维空间基变换时的计算方法，为多个向量在更高维度同时发生基变换的矩阵计算模式。而这个矩阵相乘的模式就可以用了做降维的变换，也表明该矩阵相乘（降维变换）的一种物理解

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

TX951 CSDN认证博客专家 CSDN认证企业博客

码龄13年

4: 原创

62万+: 周排名

132万+: 总排名

7979: 访问

: 等级

123: 积分

2: 粉丝

3: 获赞

6: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

总结boosting，Adaboost，Bootstrap和Bagging的含义和区别
Jankin_Lee: 博主您好，最近在看Boosting与AdaBoost算法，有一个问题一直困扰着我，都说Boosting算法的缺陷是需要知道若学习器分类的正确率下限，而AdaBoost解决了这一问题，但是我只理解了AdaBoost自适应的概念，没有理解它是如何解决这个，是否需要知道正确率下限的问题，期待您的回复。另外，有些博客说AdaBoost是对选择同一个训练集，之后更改样本的权重，直接拿来构建下一个基学习器，而您这里提到了要根据样本的权重选择样本的问题，使我有些矛盾，期待您的回复。
编辑测试
TX951: 测试完毕 ^_^！
编辑测试
TX951: [code=cpp] #include<iostream> [/code] 测试4
编辑测试
TX951 回复 TX951: 评论测试3
编辑测试
TX951: 引用「评论测试~」测试2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。