机器学习---背后数学原理--降维PCA(主成分分析)

维度灾难

  1. 从数据的角度上来看

    当你的模型增加一个特征(属性)后,你所需要的数据是以指数幂的形式增加

  2. 从几何的角度上来看

    模型维度的增加,会导致数据的稀疏性
    在这里插入图片描述

过拟合的三种解决方案:

  1. 增加数据
  2. 正则化
  3. 降维
    在这里插入图片描述

PCA(主成分分析)

数学 预备知识

由以下推导可以得出:
对于一个数据集,有N个样本,每个样本p维
则,可求出这N分样本的 样本均值(Sample Mean)的矩阵表示
和 样本协方差(Sample covariance) 的矩阵表示

在这里插入图片描述

PCA(主成分分析)的核心思想

上面的数学推导的结论为:
在这里插入图片描述

则 PCA的核心思想可以总结为
在这里插入图片描述
标准术语就是:

PCA的目标:

将相关的特征重构成无关的特征

实现这个目标的思路:
有两个,分别为:
1. 最大投影方差
2. 最小重构距离

事实上,这两种思路其实是一个意思。

最大投影方差

在这里插入图片描述

最小重构距离

在这里插入图片描述

PCA(主成分分析)------最大投影方差角度

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

PCA(主成分分析)------ 最小重构距离角度

上面的内容简单的总结一下
在这里插入图片描述
现在,我们来考虑一下 最小重构距离 的角度
在这里插入图片描述
综上所述,最小重构距离就是
在这里插入图片描述

最大投影方差和最小重构距离二者的比较

在这里插入图片描述

PCA(主成分分析)------SVD角度

等彻底明白SVD奇异值分解再回头看

PCA(主成分分析)------概率角度

等讲到变分推断再回来看

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值