理解PCA

最新推荐文章于 2023-07-29 09:52:02 发布

天岚1993_量产机

最新推荐文章于 2023-07-29 09:52:02 发布

阅读量425

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

参考资料：http://www.cnblogs.com/GatsbyNewton/articles/4776683.html

特征降维一般有两类方法：特征选择和特征抽取。特征选择即从高纬度的特征中选择其中的一个子集来作为新的特征；而特征抽取是指将高纬度的特征经过某个函数映射至低纬度作为新的特征。常用的特征抽取方法就是PCA。

当B向量为单位向量时，A和B两个向量相乘的意义在于：求A向量在B向量上的投影。
这里写图片描述

那么，如果B是一个矩阵，A是一个列向量，B的每一个行向量都是单位向量，那么B和A相乘的意义在于：求A在以B中行向量为基的空间的映射。
如果B中行向量中的数量比A中列向量的维数少，就达到降维的目的了。
那么现在问题来了，新的基怎么找？
我们肯定希望在新的空间里能够保留原空间尽可能多的信息，这就对基提出了第一个要求，新的基必须是正交的，因为如果不是正交的，每个基上携带的信息就有一定程度的重合。

协方差矩阵可以描述每个属性之间的相关性，我们希望变换后的协方差矩阵除对角线上的元素外其他元素都是0，这样就保证两个属性之间尽可能不相关。
这就需要对协方差矩阵进行对角化，用矩阵分析中的求特征值和特征向量就可以解决这个问题。

总结一下PCA的算法步骤：
设有m条n维数据。
1）将原始数据按列组成n行m列矩阵X
2）将X的每一行（代表一个属性字段）进行零均值化，即减去这一行的均值
3）求出协方差矩阵
4）求出协方差矩阵的特征值及对应的特征向量
5）将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P
6）Y=PX即为降维到k维后的数据

天岚1993_量产机

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

天岚1993_量产机 CSDN认证博客专家 CSDN认证企业博客

码龄9年

30: 原创

110万+: 周排名

42万+: 总排名

17万+: 访问

: 等级

1300: 积分

92: 粉丝

107: 获赞

24: 评论

235: 收藏

私信

关注

热门文章

分类专栏

最新评论

经典的数1问题
Hodery: 这个题目就是从1开始的
nvidia-smi 命令解读
Uylee: 你好我想问一下我输入nvidia-smi后下面process直接是空的要怎么处理呀也没说no process
经典的数1问题
djdjssss: 大佬的代码是不是存在一点问题，如果cal0(0)你的代码是不会进入循环的，最后的返回值时0，应该是1
经典的数1问题
夜阑oRZ: 大佬写的很清楚！！！
CNN通识教育：GoogLeNet
yangliuly1: Hi，我想问下：1.文中用稠密结构表示稀疏结构有助于提升网络的性能，这个稠密结构是指1x1,3x3,5x5..的并联结构吗？2.文中卷积视觉网络可以近似的最优局部稀疏结构，并且该结构可以利用现有的密度矩阵计算硬件实现，这里稠密结构，是能用硬件加速吗，怎么加速的？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。