用来处理回归数据_stata速学|聚类分析|最小二乘回归分析

db7e953eeea4e672d94548994c62bd3c.gif

NO.04

ZEYI

04.2020

正文共: 3292字 52图 预计阅读时间: 9分钟 嘿喽,我是则已。这是stata的第四期学习。 ecc0319f623cfaeba4c0b40dc1b7760e.gif 前面学习了相关分析、主成分分析与因子分析。今天来学习:聚类分析、ols回归分析。 划线部分是自己要研究的变量。 聚类分析 9438a341be6bc41aa580ce6644fc541a.png 聚类分析研究的是事物分类的基本方法,基于所研究的数据之间存在着不同程度的相似性来进行分析。主要有划分聚类法和层次聚类法。 01 划分聚类法 简划分聚类法是将样本数据划分到一系列事先设定好的不重合的分组去。划分聚类方法有两种:K个平均数的聚类分析法、K个中位数的聚类分析法。

9eb4096de486d2c5874a50e19444188d.png

首先依次对变量进行标准化处理: egen zv2=std(V2) egen zv3=std(V3) egen zv4=std(V4) 对变量进行描述性分析:sum zv2 zv3 zv4 ed9588cf457f6735a731da824eaabe80.png 结果分析:可以看到均值基本上为0,标准差为1,说明标准化起到了一定效果。 进行K个平均数的聚类分析,并且分为两类:cluster kmeans zv2 zv3 zv4,k(2) a2c129f3b5af39268b12fa7ec107a75c.png 打开上方的数据浏览界面: 0ddb50449a32a05be91cf68bef3e1469.png 结果分析:可以看到数据被分为了1类和2类,观察每个分类特征,可以看到1类的变量zv2,zv3,zv4的值大都是比2类的高,基本是正数。 也可以分为三类:cluster kmeans zv2 zv3 zv4,k(3) a1b27689b85b563bcb19de16c796e1ee.png c8d9af5f682e2c725f30e68280b074ac.png 接下来介绍另外一种分类方法,按中位数划分聚类层次: cluster kmedians zv2 zv3 zv4,k(2) 1b0c99a54da35dd792286ba4a88ade28.png
  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值