用户画像之指标权重
1、指标确认
2、指标缩减
3、权重确定
关键指标–主成分分析(SPSS)
PCA(主成分分析)是一种降维方法,常用于对高维数据集作降维,它会将一个大的变量集合转化为更少的变量集合,同时保留大的变量集合中的大部分信息。即对指标进行降维操作使其只保留关键指标。
1、判断数据是否适合主成分分析
- KMO检验:KMO值大于0.6说明适合进行分析,反之,说明不适合进行分析。
- Bartlett检验:对应P值小于0.05也说明适合分析。
2、确定主成分个数
- 方差解释率表格:方差解释率越大说明主成分包含原数据信息的越多。
- 碎石图:折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。
- 载荷系数表格:载荷系数绝对值大于0.4归于第一主成分,共同度为可被提取的信息量,越高说明指标能被主成分解释的程度越高,被提取的信息量越多。一般以0.4作为标准。
3、利用主成分得到综合得分
数据处理中进行得分结果汇总。
综合得分=主成分1得分主成分1权重+主成分2得分主成分2权重+…
权重=各主成分对应的方差贡献率/累计方差贡献率
权重确认–嫡值法
详细视频操作指路
1、数据标准化
-
数据缺失值极值处理
-
确认正负样本(为了避免求熵值时无意义,每个指标结果加上实数,如+0.001)
正相关指标(指标