引言
虽然没有仔细推导书中较为繁琐的公式,但是对于以应用为主的我来说已经够了。最重要的还是了解多元统计的思想和解决问题分析步骤。
因子分析也是一种降维技术,但是它跟主成分分析又有很大不同。主成分分析主要是将多个变量线性组合为少数几个变量来表示原来绝大部分信息。而因子分析主要是寻找多个变量之间隐藏的不能观测的因子,来表示各个变量之间的相关关系。比如从高中各科成绩中通过因子分析来找到理科成绩因子、文科成绩因子等。
数据与书籍下载前往 多元统计分析上机题之R语言实现(多元正态分布) 。
因子分析的基本步骤
1.为避免各变量量纲对结果的不利影响,数据标准化处理,用scale()函数
2.标准化数据的相关矩阵,用cor()函数
3.求相关矩阵的特征值和单位特征向量,用eigen()函数,根据特征值大于1的个数,确定因子的个数
4.因子分析,利用psych包中的fa(r=cor_a,nfactors=2,fm="pa",rotate="none")函数,该函数为多元统计分析的一个包;nfactors为因子个数,fm为估计解的方法:pa为主成分法,ml为极大似然估计法;rotate为是否进行旋转;
5.根据因子载荷矩阵进行解释,如果不好解释,进行因子旋转,然后进行解释。解释可结合fa.diagram函数对载荷矩阵进行可视化
6.因子旋转:fa(r=cor_a,nfactors=2,fm="pa",rotate="varimax"),用最大方差旋转正交法
7.求因子得分:由最小二乘法和回归法: