主成分分析(PCA)

主成分分析

数据降维

在某些限定条件下,降低随机变量个个数,得到一组“不相关”主变量的过程。

作用:

  • 减少模型分析数据量,提升处理效率,降低计算难度
  • 实现数据可视化

主成分分析(PCA)

目标: 寻找k(k<n)维新数据,使他们反映事物的主要特征

核心: 在信息损失尽可能少的情况下,降低数据维度

投影后的不同数据特征尽可能分得开(即不相关)可以保留主要的信息;

实现方式:使投影后数据的方差最大,因为方差越大数据也越分散

计算过程:

  1. 原始数据预处理(标准化: μ = 0 , σ = 1 \mu=0, \sigma=1 μ=0,σ=1
  2. 计算协方差矩阵特征向量、及数据在各特征向量投影后的方差
  3. 根据需求(任务指定或方差比例)确定降维维度k
  4. 选取k维特征向量,计算数据在 其形成空间的投影
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值