Factor_Analysis

Factor_Analysis(因子分析)
Factor Analysis 简书:较好理解的解释,其中公式有一定的推导(仅展现关键步骤,细节大多需要自行补充),基本为结论式。

感性层面理解:首先,明确FA和PCA的区别。PCA做的是对某个样本,试图寻找到一组方差尽量大的线性表示(基向量),以便降维;FA做的是,假想存在一些隐变量,它们影响着我们的观测结果(即我们得到的数据样本),我们试图找到两者的联系:$x = \Lambda z + \mu + \epsilon$,在简书中有说明其MLE函数形式,不难看出它的MLE形式难以求解,故采用EM(机器学习之最大期望(EM)算法,讲得不错)迭代以求最优解。此外,FA通常用于$m<<n$的庆幸

心路历程:首先,我去推了一下EM,发现自己之前学的时候,由于是在GMM求解的时候需要的,所以并没有很仔细地推导,所以就再去推导了一次推了我一页草稿纸。其次,没有找到:$\mu_{x_1|x_2} = \mu_1 + \Sigma_{12} \Sigma_{22}^{-1} (x_2 - \mu_2)$ 以及 $\Sigma_{1|2} = \Sigma_{11} - \Sigma_{12} \Sigma_{22}^{-1} \Sigma_{21}$ 的公式名称,如果看官知晓其名称,望告知不才,感激不尽。最后,还是忘记了矩阵求导,又去查了一下,而我也尚未进行公式回带和化简整合。自闭了,一大堆

疑问:简书作者在开头提到:由于存在隐变量,同时不能由MLE得到close form。(close form:即闭式解,通俗解释就是$\nabla f(x) = 0$的$x$表达式),这里不理解为何没有闭式解,目前推的结果(MLE式子),大概猜测是因为$m<<n$的缘故,这样带来的结果就是$\left| \Sigma \right| = 0$(其实本身$\left| \Sigma \right|$是不等于0的,但是由于$m<<n$,所以它等于0,其实就是由于样本数量不足,或者说难以得到如此高维并且充足的样本)。显然,$\left| \Sigma \right| = 0$会在后续中遇到诸多麻烦,最容易想的就是$\Sigma$是不可逆的,这显然很难进行接下来的计算,虽然我算的不多,但是$\Sigma^{-1}$几乎都是需要的。然而,可以引入伪逆,所以肯定还有我没有想到的原因,或者说伪逆会带来较差的表现等等。

备注:由于博客园写推导公式较为麻烦,所以没有在博客上进行推导,不过建议看官如果并未学习过上述知识,还是手推几次以便加强理解和记忆(当然也有一些少年仅仅看就能得到很好理解,并且运用巧妙)。比如在EM算法中,求解lower_bound之前,分子分母同乘一个量以便之后用Jensen不等式化简(orz)等等(好像其他的操作就比较平凡了)。最近闲来无事的时候,发现很多学习过的算法,特别是需要一定数学式子或者思维来求解的(我竟然想去求LCM解烤鸡??),似乎都忘了需要求解的表达式(嘴上讲讲天花乱坠,手里推推苦思冥想),虽然求解过程都不难,但是对于我来说,其中一些技巧还是需要理解的有些计算量也是大啊

转载于:https://www.cnblogs.com/FormerAutumn/p/11516015.html

这段代码看起来是使用 `scikit-learn` 库执行因子分析并获取因子得分的示例。其中,`df` 是数据矩阵,`n_components` 参数指定你要提取的因子数量。 但是,你在代码中调用了 `fa.get_communalities()` 和 `fa.get_factor_variance()` 方法,这两个方法在 `scikit-learn` 的 `FactorAnalysis` 类中并不存在。因此,你可能会遇到与上一个问题类似的错误:`'FactorAnalysis' object has no attribute 'get_communalities'` 和 `'FactorAnalysis' object has no attribute 'get_factor_variance'`。 如果你想获得因子分析的公因子方差和解释的总方差,可以使用 `FactorAnalysis` 类的 `get_covariance()` 方法和 `explained_variance_ratio_` 属性,如下所示: ``` python from sklearn.decomposition import FactorAnalysis # 创建一个 FactorAnalysis 对象 fa = FactorAnalysis(n_components=6) # 对数据进行因子分析 fa.fit(df) # 获取因子得分 factor_scores = fa.transform(df) print("因子得分:\n", factor_scores) # 获取公因子方差 cov = fa.get_covariance() communalities = np.diag(cov) print("公因子方差:\n", communalities) # 获取解释的总方差(即贡献率) variance_ratio = fa.explained_variance_ratio_ print("\n解释的总方差(即贡献率):\n", variance_ratio) ``` 在上面的代码中,`fa.get_covariance()` 方法返回因子分析的协方差矩阵,`np.diag()` 方法将其转换为一个对角矩阵,其中对角线上的值就是公因子方差。`fa.explained_variance_ratio_` 属性返回每个因子解释的总方差百分比。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值