bysort分组求和不成功的原因(求和变量为字符串类型)

问题描述

  • 原始数据类型如下图所示,下图显示2008年上海的RDSpendSum有多个数值,接下来需要用bysort函数将这个变量在各个城市的年份层面汇总。
    在这里插入图片描述
  • 于是直接使用如下命令,但是结果显示并没有实现上述目标,呈现的结果和上图一样。
bysort CITY 年度:egen RD = sum(RDSpendSum)

解决办法

  • 使用bysort函数前需要先对求和变量解码,将其变成数值,另外如果分组变量是数值,也需要使用destring命令解码。
destring  RDSpendSum 年度,replace
bysort CITY 年度:egen RD = sum(RDSpendSum)
  • 使用上述命令得到的结果是具有重复值的数据,如下图所示,所以还需要使用去重的命令。
  • 首先keep 城市 年度 RD选择所需变量,再使用 duplicates drop 城市 年度 RD,force命令即可。

在这里插入图片描述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值