主成分分析PCA

数据降维的意义

1.维数灾难

高维数据空间给机器学习算法带来的计算量是十分巨大的。事实上,在高维情形下出现的数据样本稀疏、距离计算困难等问题,是所有机器学习方法共同面临的严重障碍,被称为“维数灾难”。

缓解维数灾难的一个重要途径就是降维,即通过某种数学变换将原始高维属性空间转变为一个低维“子空间”,这个子空间内样本密度大幅提高,距离计算也变得更为容易。

为什么能进行降维呢?这是因为在很多时候,人们观测或收集到的数据样本虽是高维的,但与学习任务密切相关的也许仅是某个低维分布,即高维空间的一个低维“嵌入”,在这个低维空间学习起来效率更高,如下图所示。



2.数据可视化

当数据处于高维度时,我们比较难直观地发现其特性和各数据维度的关系。但当通过降维处理使得数据只有两维或者三维时可以通过画图寻找其中存在的规律。

例如下面这个反应各个国家经济发展状态的例子,不同国家对应二维图上的一个点。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值