主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量的相关变量转化为一组很少的不相关的变量,这些无关的变量称为主成分,例如,可以使用PCA把30个相关的信息转化为5个无关的成分变量,因为30个相关信息里面存在冗余。
探索性因子分析(EFA)是一种用来发现一组变量潜在结构的方法,可以通过寻找一组更小的,潜在的或隐藏的结构来解释已观测到的,显式的变量间的关系。
psych包中有用的因子分析函数:
使用principal()函数可以根据原始数据或者矩阵做主成分分析,格式为:principal(r,nfactors=,rotate=,scores=)
参数的解释如下:
以下是305个女孩身体指标间的相关系数:
我们需要用较少的变量来替换这些原始身体指标,如下代码可以判断提取的主成分数目:
如上图,其中碎石图,直线和x组成的连线,特征值大于1的准则线和100次模拟的平行分析,建议保留两个主成分。
可以看到,nfactors=2,说明两个主成分,proportion=0.58和0.22分别说明两个主成分代表的比例