数据分析——因子模型&聚类分析

本文介绍了数据分析中的两种重要方法:因子模型和聚类分析。因子模型旨在解决数据维度过大的问题,通过构建因子模型来降低维度,包括主成分分析法、主因子法和极大似然估计。聚类分析则是将对象分组为相似的类,常见的方法有系统聚类法和K-均值法。文章还提供了MATLAB代码示例,以及因子模型构建的详细步骤,包括因子旋转和计算因子得分。
摘要由CSDN通过智能技术生成
  • 聚类分析

百度百科:聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。

方法——(还可直接用SPSS)

  1. 系统聚类法(适用于数据量比较小的情况)

  2. K-均值法:先把样品粗略分为K个初始类别,逐个分派样品到其最近均值的类中(通常用标准化数据计算欧式距离),重新计算类的均值,直到没有新元素的进出情况。

matlab代码——

Y=pdist(X);
SF=squareform(Y);
Z=linkage(Y,'average');
dendrogram(Z);
T=cluster(Z,'maxclust',n) %n是类的最大数目

%代码参考:https://blog.csdn.net/henu111/article/details/81512314
  • 因子模型&主成分分析

因子模型的提出主要是为了解决数据维度过大的问题,假设原有P个X变量,现通过用少于P的m个F变量对X进行衡量,其中A为变换系数矩阵,里面的元素可以称为因子载荷,类比标准化后的β参数,其绝对值越大越好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值