为什么?
SPSS 那么简单还免费,为什么还要用 Python 做因子分析(factor analysis)呢?工作狗表示,建模的目的是要卖钱的,也就是要嵌入到公司开发的产品上去,用 Python 写因子分析(factor analysis),总比找SPSS的接口更容易让大家接受。
算法核心
因子分析法(factor analysis)的核心是对若干综合指标进行因子分析并提取公共因子,再以每个因子的方差贡献率作为权数与该因子的得分乘数之和构造得分函数。
Python代码
先把该装上的模块都装上哈,比如:factor_analyzer
安装方法:
- 系统解释器: pip install factor_analyzer;
- conda-jupyter:conda install -c desilinguist factor_analyzer;
第一步:看原数据
总觉得看到原数据是个什么样子,心里才有点谱,所以基本每一篇博客都要先展示一下原数据。
import pandas as pd
import numpy as np
from pandas import DataFrame,Series
from factor_analyzer import FactorAnalyzer
datafile = u'D:\\pythondata\\textdata.xlsx'
data = pd.read_excel(datafile)
data.head()
指标1 指标2 指标3 指标4 指标5 指标6 指标7 指标8 指标9 指标10 0 0.003790 0.003790 0.004935 0.0076 0.4