NO.04
ZEYI
04.2020
正文共: 3292字 52图 预计阅读时间: 9分钟 嘿喽,我是则已。这是stata的第四期学习。 前面学习了相关分析、主成分分析与因子分析。今天来学习:聚类分析、ols回归分析。 划线部分是自己要研究的变量。 聚类分析 聚类分析研究的是事物分类的基本方法,基于所研究的数据之间存在着不同程度的相似性来进行分析。主要有划分聚类法和层次聚类法。 01 划分聚类法 简划分聚类法是将样本数据划分到一系列事先设定好的不重合的分组去。划分聚类方法有两种:K个平均数的聚类分析法、K个中位数的聚类分析法。 首先依次对变量进行标准化处理: egen zv2=std(V2) egen zv3=std(V3) egen zv4=std(V4) 对变量进行描述性分析:sum zv2 zv3 zv4 结果分析:可以看到均值基本上为0,标准差为1,说明标准化起到了一定效果。 进行K个平均数的聚类分析,并且分为两类:cluster kmeans zv2 zv3 zv4,k(2) 打开上方的数据浏览界面: 结果分析:可以看到数据被分为了1类和2类,观察每个分类特征,可以看到1类的变量zv2,zv3,zv4的值大都是比2类的高,基本是正数。 也可以分为三类:cluster kmeans zv2 zv3 zv4,k(3) 接下来介绍另外一种分类方法,按中位数划分聚类层次: cluster kmedians zv2 zv3 zv4,k(2)