机器学习---降维之PCA主成分分析法

本文介绍了PCA(主成分分析)的主要目的——降维,并详细阐述了PCA的算法流程、如何从压缩数据中恢复原数据以及如何决定降维的主成分个数。同时,讨论了在机器学习中不应依赖PCA解决过拟合问题,建议使用正则化项。PCA应在训练数据上进行,用于改善处理结果不理想的情况。
摘要由CSDN通过智能技术生成


(一)、主成分分析法PCA简介 

  • PCA 目的:降维——find a low dimension surface on which to project data ~
如图所示,寻找蓝色的点到直线的垂直距离的和最小的直线(向量)


 PCA 与 Linear Regression 的区别:
 PCA衡量的是点到直线的垂直距离, 而linear regression是所有x点对应的真实值y=g(x)与估计值f(x)之间的vertical distance距离,如下图所示:



(二)、PCA 算法流程 


假设有m个samples,每个数据有n维。

第一步:数据处理
首先要进行数据正则化,将点的各个features处理在相同的数量级。



 第二步:PCA算法选取k个主分量

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值