因子分析及R语言实现

概念:

降维的一种方法,是主成分分析的推广和发展
是用于分析隐藏在表面现象背后的因子作用的统计模型。试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量
例子:各科学习成绩(数学能力,语言能力,运动能力等)
例子:生活满意度(工作满意度,家庭满意度)
可分为R型和Q型因子分析:
R型是基于变量之间的相关关系,研究变量相关矩阵或协方差阵;
Q型基于样本之间的相关关系,研究样本的相似矩阵内部结构。

主要用途:

减少分析变量个数
分类
通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变量分为一组,用共性因子来代替该变量
使问题背后的业务因素的意义更加清晰呈现


与主成分分析的区别:

主成分分析侧重“变异量”,通过转换原始变量为新的组合变量使到数据的“变异量”最大,从而能把样本个体之间的差异最大化,但得出来的主成分往往从业务场景的角度难以解释
因子分析更重视相关变量的“共变异量”,组合的是相关性较强的原始变量,目的是找到在背后起作用的少量关键因子,因子分析的结果往往更容易用业务知识去加以解释

数学方法:

求解模型的方法:主成分法,主因子法,极大似然法
结果还可以通过因子旋转,使到业务意义更加明显

因子载荷矩阵和特殊方差矩阵的估计:

主成分法:通过样本估算期望和协方差阵;求协方差阵的特征值和特征向量;省去特征值较小的部分,求出A、D
主因子法:首先对变量标准化;给出m和特殊方差的估计(初始)值;求出简约相关阵R*(p阶方阵);计算R*的特征值和特征向量,取其前m个,略去其它部分;求出A*和D*,再迭代计算。
极大似然法

方差最大的正交旋转:

由于因子载荷矩阵不是唯一,有时因子的实际意义会变得难以解释,不满足“简单结构准侧”,即各个公共因子的典型代表变量很不突出,因此要进行旋转变换,使得载荷值趋于1或趋于0,公共因子具有简单化的结构。
因子载荷矩阵的正交旋转
因子载荷方差
varimax( ) 函数

R语言实现:


factors如何确定,一般有两种方法:

①根据实际问题的意义或专业理论知识来确定。
②用确定主成分个数的原则,选m为满足


p为样本方阵的行数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值