PCA

最新推荐文章于 2021-03-23 10:21:11 发布

weixin_38168382

最新推荐文章于 2021-03-23 10:21:11 发布

阅读量101

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/xcxy-boke/p/11405052.html

版权

PCA本质上是一个有损的特征压缩过程，但是我们期望损失的精度尽可能地少，也就是希望压缩的过程中保留最多的原始信息。要达到这种目的，我们希望降维（投影）后的数据点尽可能地分散。

基于这种思想，我们希望投影后的数据点尽可能地分散。而这种分散程度在数学上可以利用方差来表示。设降维后的特征为 A，也就是希望 $var(A)= \frac{1}{m}\sum_{i}^{m}({a}_{i}-{\mu}_{a} )^{2}$，而由于在PCA降维前，一般已经做了特征零均值化处理，为了方便，记$var(A)= \frac{1}{m}\sum_{i}^{m}({a}_{i})^{2}$，同样，为了减少特征的冗余信息，我们希望降维后的各特征之间互不相关。而不相关性可以用协方差来衡量。设降维后的两个特征为A、B的协方差为0。

所以问题就是对Y进行对角化，即方差最大而协方差为0。运用到谱分解（特征向量和特征值）。

转载于:https://www.cnblogs.com/xcxy-boke/p/11405052.html

weixin_38168382

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PCA

PCA本质上是一个有损的特征压缩过程，但是我们期望损失的精度尽可能地少，也就是希望压缩的过程中保留最多的原始信息。要达到这种目的，我们希望降维（投影）后的数据点尽可能地分散。基于这种思想，我们希望投影后的数据点尽可能地分散。而这种分散程度在数学上可以利用方差来表示。设降维后的特征为 A，也就是希望 $var(A)= \frac{1}{m}\sum_{i}^{m}({a}_{i}-{\...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。