主成分分析(Principal Component Analysis)

主成分分析(Principal Component Analysis)

主成分分析(PCA)是一个被广泛用于降维、有损数据压缩、特征提取和数据可视化的技术。PCA有两种常用的定义,分别是从最大化投影后数据的方差和最小化投影后数据与原始数据之间的误差两个角度考虑的。两个定义最终的结果是一致的,我们从方差最大化的角度具体讨论一下PCA。

  • 方差最大化
  • PCA的代码实现

方差最大化

考虑一个观察的数据集 { xn},n=1,...,N ,并且 xn 是一个 D 维的变量。当我们从方差最大化的角度去考虑PCA的时候,我们的目标其实是要将原始数据投影到一个低维(维数 M<D )空间,并且要最大化投影后的数据的方差。为了讨论的简便,我们假设 M 是给定的。
首先我们考虑 M=1 的情况。我们用一个 D 维的单位向量 u1 来表示低维空间的方向。从原始数据到低维空间的投影可以由 uT1xn 来获得。所以低维空间上数据的均值为

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值