STATA横向数据匹配

  • 目标:把公司的数据和到一张表上
    我在国泰安上下载了A股上市公司2008-2016年的某些数据,要做描述性统计和相关性分析,但数据合并对我来说是个问题。先后尝试了excel的vlookup函数,奈何自己技术不过关,数据量又大(1.9万条),过程中excel容易卡,匹配结果大部分为空,当时什么都不会,有点想人工匹配了,迷之工作量。因为一些原因,我这一学期才接触数据库,技术也不行,给同组同学诉苦,他说,可以用数据库帮我合并,几条语句,很快。
    没过一会儿,他就合并好,发给了我。我真的万分感谢,觉得离作业完成只差一步之遥,数据全有了,只差计算了。并感叹数据库的神奇,暗下决心好好学习数据库!
    过来一段时间,我计算指标时,发现里面缺了几年的数据,但里面已经有2.7万条数据。在合并过程中,有很多重复数据(例如,某几个个案,里面仅有1,2个不同的属性)。我刚学习了左外连接,让他帮我左外连接的,他说,左外连接的结果很奇怪,会出现很多奇怪的东西。我怕数据量暴增,就重新跟他交代了每张表之间数据匹配的依据,结果出来的数据还是少了几年的,导致里面一个指标无法计算。

  • 转机
    在第二天课中,偶然发现stata可以做纵向和横向数据匹配,并询问了老师,她给我说,一对一,多对多,1对多(在横向数据匹配中),我后来查询了,但不是很清楚。就直接用代码上手了(参考的stata教程

  • 5
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值