因子分析(Factor Analyse)推导以及R语言实现

最新推荐文章于 2024-05-27 09:26:35 发布

rederchen

最新推荐文章于 2024-05-27 09:26:35 发布

阅读量6w

点赞数 21

分类专栏：多元统计文章标签：因子分析因子模型降维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35719435/article/details/81070911

版权

因子模型

对于降维算法里，大家熟知的是SVD和PCA，甚至是t-sne。但在统计解释上来说，降维算法找到了相应的低维子空间，但解释力不足，比如PCA，对于降维后数据的解释力降低。因此对于小规模数据集，在变量众多的情况下，因子模型是较好的处理多变量的方法。通过PCA降维估计，再进行因子旋转，使得因子模型在降维的同时具备了较好的解释力。

准备工作

因子模型假设中心化的X线性依赖于一些未观测到的随机变量 $F_1,...,F_m$ 和误差，称 $F_1,...,F_m$ 为公共因子，因子模型可表示为以下一式：

$X-\mu = LF + \varepsilon$
其中

L=(lij)p×m L = ( l i j ) p × m $L = (l_{ij})_{p\times m}$ 为因子载荷矩阵，

lij l i j $l_{ij}$ 为第i个变量在第j个因子上的载荷（描述了第i个变量和第j个因子的相关性），

Fm×1 F m × 1 $F_{m\times 1}$ 称为公共因子，

εp×1 ε p × 1 $\varepsilon_{p\times 1}$ 称为特殊因子。
因子模型假设：
1.

E(F)=0,Cov(F)=Im E ( F ) = 0 , C o v ( F ) = I m $E(F)=0,Cov(F)=I_m$
2.

E(ϵ)=0,Cov(ϵ)=φp×p=diag(φ1...φp) E ( ϵ ) = 0 , C o v ( ϵ ) = φ p × p = d i a g ( φ 1 . . . φ p ) $E(\epsilon)=0,Cov(\epsilon)=\varphi_{p\times p} = diag(\varphi_1...\varphi_p)$
3.

Cov(ε,F)=0 C o v ( ε , F ) = 0 $Cov(\varepsilon,F)=0$
4.

Cov(X)=Σp×m=LL′+φ,Cov(X,F)=Lp×m C o v ( X ) = Σ p × m = L L ′ + φ , C o v ( X , F ) = L p × m $Cov(X) = \Sigma_{p\times m} = LL' + \varphi , Cov(X,F) = L_{p\times m}$

其中第四条假设为因子模型的核心，则对于i=1,…,p,令 $l_{(i)}$ 为L的第i行，则有：

{V

最低0.47元/天解锁文章

关注

21
点赞
踩
194

收藏

觉得还不错? 一键收藏
3
评论
因子分析(Factor Analyse)推导以及R语言实现

因子模型对于降维算法里，大家熟知的是SVD和PCA，甚至是t-sne。但在统计解释上来说，降维算法找到了相应的低维子空间，但解释力不足，比如PCA，对于降维后数据的解释力降低。因此对于小规模数据集，在变量众多的情况下，因子模型是较好的处理多变量的方法。通过PCA降维估计，再进行因子旋转，使得因子模型在降维的同时具备了较好的解释力。准备工作因子模型假设中心化的X线性依赖于一些未观测到的随...
复制链接

扫一扫

专栏目录

rederchen CSDN认证博客专家 CSDN认证企业博客

码龄8年

16: 原创

10万+: 周排名

199万+: 总排名

44万+: 访问

: 等级

1886: 积分

60: 粉丝

109: 获赞

19: 评论

616: 收藏

私信

关注

热门文章

分类专栏

最新评论

广义线性模型(GLM)初级教程
荒野大镖客2: 想问下，FS和IRLS的J和W矩阵，是怎么得到的，文章中只给了结论，有没有详细一点的过程
非负Lasso回归的R语言实现
qq_48537868: 你好，论文的百度网盘资源已经失效了，可以在发一次吗
降维方法总结（线性与非线性）
王乐予: 博主写的很好，受教了
因子分析(Factor Analyse)推导以及R语言实现
weixin_43162403: L_1 = sqrt(lambda[1])*vectors[,1] L_2 = lambda[2]*vectors[,2] L = cbind(L_1,L_2) # L = sqrt( 这里的第二行写错了，应该是L_2 =sqrt(lambda[2])*vectors[,2]
统计量及其分布
「已注销」: 博主写得很不错，分享是一种美德。大大的赞！加油。也希望博主坚持写下去。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。