如何用Stata完成(shui)一篇经济学论文(十一):分组和去重

文章目录


不出意外的话,这应该是stata有关数据处理的最后一篇。emmm,其实我一开始只打算写数据处理部分的stata教程,因为我觉得对于我来说,数据处理才是最头疼的部分。不过关于后面回归,还是有些东西想跟大家分享一下(开始挖坑),后面能写多少,就看造化吧,这里还是说一句,数据处理部分完结撒花~~

分组

Stata中分组命令其实有by和bysort两个,但根据官方文档:“by and bysort are really the same command; bysort is just by with the sort option.” 所以此处只介绍bysort命令。
直接上代码:

* 官方代码 *
bysort varlist: stata_command

bysort后接用于分组的变量名(可以有多个),再接要进行的stata操作。举个例子:

* 使用系统数据库 *
sysuse auto
* 生成国产车和进口车分别的均价 *
bys foreign :egen avg_price = mean(price)
* 根据foreign以及headroom进行分类生成均价 *
bys foreign headroom :egen avg_price1 = mean(price)

如果大家运行了这段代码,可以看到bysort命令不仅仅根据变量进行分组计算,同时还对数据进行了排序,排序依据就是我们分组所用的变量。(图一为使用bysort命令前,图二为使用命令后)

  • 10
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值