R语言实战笔记–第十四章 主成分和因子分析
标签(空格分隔): R语言 主成分分析 因子分析
原理及区别
主成分分析与因子分析很接近,其目的均是为了降维,以更简洁的数据去解释结果,但这两种方法其实是相差甚远,有幸找到一篇博文描述了这两者的不同,主成分分析和因子分析十大不同点【原文连接】,在这里引用(略有更改)一下。
不同点 | 主成分分析 | 因子分析 |
---|---|---|
原理 | 每个主成分均为所有原始变量的线性组合,且各个主成分之间互不相关(但需要注意的是,主成分必须保留原始变量90%以上的信息,R语言实战中为保留85%) | 把所有原始变量变成几个公共因子和仅对某一个变量有关的特殊因子组成,提取解释作用的少数因子,原始变量可观测,但公共因子不可观测。 |
线性表示方向 | 把方成分表示为各原始变量的线性组合 | 把原始变量表示成各因子的线性组合 |
假设条件 | 不需要 | 各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 |
求解方法 | 从相关阵出发,可以适当避免变量间的差异,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题(会出现最小特征根接近0的情况) | 主成分法,主轴因子法,极大似然法,最小二乘法, α |