在前面的章节中我曾经介绍了lm()线性回归等方法,这些方法的基本特征都是通过几个观测变量来对预测变量进行预测,这章接着介绍下和这部分相关的几个内容
1.主成分分析:当观测变量过多时,可以将这些观测变量综合为一个或多个其他的变量(因子),利用这些变量来进行预测,模型拟合,这些其他的变量就称之为主成分,其分析步骤为:
确定主成分个数:fa.parallel(数据集,fa="PC",n.iter=模拟次数),通过该方法所得的图形来确定主成分个数,该图中横坐标为因子个数,纵坐标为特征值,从特征值大于1的因子个数中选择最大的那个因子个数作为主成分个数
确定主成分:principal(数据集,nfactors=主成分个数,rotate="none"/"varimax",...)
获取主成分的得分:PC$scores,根据各因子的得分以及最初的观测变量的值来对预测变量进行预测
2.潜在因子分析:感觉它和主成分分析有点相似,主成分分析是将各观测变量进行综合,而潜在因子分析是将各个观测变量分解为相同因子的组合,而这些因子是我们未能直接观测到的值,其分析步骤如下: