数据分析——因子模型&聚类分析

YNGT5416

于 2019-09-22 16:07:00 发布

阅读量1.5k

点赞数

原文链接：http://www.cnblogs.com/caiweijun/p/11567858.html

版权

本文介绍了数据分析中的两种重要方法：因子模型和聚类分析。因子模型旨在解决数据维度过大的问题，通过构建因子模型来降低维度，包括主成分分析法、主因子法和极大似然估计。聚类分析则是将对象分组为相似的类，常见的方法有系统聚类法和K-均值法。文章还提供了MATLAB代码示例，以及因子模型构建的详细步骤，包括因子旋转和计算因子得分。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

聚类分析

百度百科：聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。同一个簇中的对象有很大的相似性，而不同簇间的对象有很大的相异性。

方法——（还可直接用SPSS）

　　1. 系统聚类法（适用于数据量比较小的情况）

　　2. K-均值法：先把样品粗略分为K个初始类别，逐个分派样品到其最近均值的类中（通常用标准化数据计算欧式距离），重新计算类的均值，直到没有新元素的进出情况。

matlab代码——

Y=pdist(X);
SF=squareform(Y);
Z=linkage(Y,'average');
dendrogram(Z);
T=cluster(Z,'maxclust',n) %n是类的最大数目

%代码参考：https://blog.csdn.net/henu111/article/details/81512314