主成分分析的理解

机器学习处理完数据后,接下来就要进行筛选特征(我的特征总共有40个),这块有两件事要做:
(1)特征之间可能存在强相关性
(2)筛选重要特征
我开始想的是先用随机森林算法筛选重要特征,再处理相关性的问题,但是其实直接用PCA就能完成上面的两件事(目前是这样理解的,不知道对不对)
1.概念
主成分分析的提出:principal component analysis,是将多个指标化为少数几个综合指标的一种统计分析方法,即通过降维技术把多个变量化为少数几个主成分的方法。
基本思想:将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标。
目的:是用较少的变量去解释原资料中的大部分变异(方差),即期望能将手中许多相关性很高的变量转化成互相独立(正交)的变量,并能解释大部分资料之变异的几个新变量,即主成分。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值