【读书笔记】统计学:从数据到结论 第十章

第十章 主成分分析和因子分析


   当变量很多,且有些变量是相关的时候,为了找出少数能够代表它们的变量,就要用到主成分分析和因子分析,所以,主成分分析和因子分析都是用来降维的。

  • 主成分分析
    假定原先数据是二维观测值,在一个二维坐标系中,这些数据点形成一个有椭圆形轮廓的点阵,这个椭圆有两条轴,一条长轴和一条短轴,互相垂直,长轴承担了数据比较多的变化,代表了数据包含的大部分信息,一半来说将这个长轴代表的变量作为降维后的变量就可以完成降维的任务了。长轴和短轴这两条轴代表的变量就叫主成分,这两条轴叫主轴,主轴的长度叫特征值。
    如果两条轴分别和坐标系平行,那这两条轴就是两个主成分,但是很多情况下,这两条轴不和坐标轴平行,就需要做一些变换,创建两个新的变量分别和两条坐标轴平行,新的变量是原先的变量的线性组合,这时,这两个新的变量就是主成分。
    主成分分析是,先找出所有主成分,主成分数量和原数据的变量个数是一样的,然后取最长的几个主成分,至于取几个,一般取所选主轴总长度占所有主轴长度之和的大约85%。
    主成分由原变量线性组合而成,每一个原变量前的系数称为主成分载荷,表示的是主成分和原先变量的线性相关系数。
  • 因子分析
    因子分析更精密,结果更有说服性,可以说主成分分析是因子分析的特例。
    因子分析事先确定要找几个成分,也称因子,也就是说,主成分分析有几个变量就有几个主成分,因子分析是先确定有几个成分,数量不一定要等于原变量个数。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值