PCA和FA之间的区别
因子分析时主成分分析的推广和发展。二者都是用于降维。
主要区别是,PCA是根据方差最大来进行降维,而FA是根据变量间的依赖关系进行降维。
一、但是,
1)方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外,还有特殊因子,公因子只解释了部分信息,所以有方差损失。
2) 唯一性:主成分分析不存在因子旋转(jPCA是什么?),主成分是唯一的;因子分析进行因子旋转,解不唯一。
3)实际意义:PCA没有实际意义;公因子有实际意义。
4)应用:主成分侧重信息贡献,影响力综合评价;因子分析侧重因子的综合评价。
二、原理上的不同:
PCA利用线性变化的思想,在损失很少信息的前提下,把多个指标转化为几个不相关的综合指标(主成分),即每个PC都是原始变量的线性组合,使得PC比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。
FA从数据出发,描述原始变量之间的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和对某一个变量有作用的特殊因子线性组合而成。
三、线性表示方向不同:
PCA中吧PC表示成各变量的线性组合,而因子分析是把变量表示成各公共因子的线性组合。
四、假设条件不同:
PCA不需要假设条件;FA需要一些假设。
因子分析的假设包括:各个公共因子之间不相关,特殊因子之间也不相关,公共因子和特殊因子之间也不相关。
五、PC的数量不同
PCA中PC的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。而FA的因子个数需要分析者指定,指定的因子数量不同而结果也不同。
六、应用范围不同
PCA提取出来的PC无法解释其代表的含义,而FA可以确切的提出公共因子。