? 连享会主页:lianxh.cn
? 因果推断-内生性 专题 ⌚ 2020.11.12-15
? 主讲: 王存同 (中央财经大学);司继春(上海对外经贸大学)
? 课程主页:https://gitee.com/arlionn/YG
? 诚邀助教 10 名,详见课程主页。
作者:刘涛 (中山大学岭南学院)
邮箱:liut75@mail2.sysu.edu.cn
目录[
1. 问题描述
2. 解决方法
3. 哪种方法好?
4. 总结
5. 参考资料
附: 伍德里奇老兄的提问原文
NEW!连享会·推文专辑:
Stata资源 | 数据处理 | Stata绘图 | Stata程序
结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据
交乘调节 | DID | RDD | 因果推断 | SFA-TFP-DEA
文本分析+爬虫 | 空间计量 | 学术论文 | 软件工具
连享会学习群-常见问题解答汇总:
? WD 主页:https://gitee.com/arlionn/WD
写在前面: 相信《小蝌蚪找妈妈》是不少人的童年回忆。在数据处理中,我们常常需要处理像「小蝌蚪」要找到「妈妈」的数据,并将它们成功匹配。
本文将借助 伍德里奇教授 在
statalist
论坛的 提问和后续讨论 来讲讲利用 Stata 数据处理中「小蝌蚪」找到「妈妈」的故事。在推文的末尾,我们也附上了伍德里奇教授在论坛里提问时的原贴。我们能从中能够感受到严谨的治学态度。即使是提出这么一个简单的问题,他也会花大量的篇幅来描述问题的背景,并附上自己测试的一些代码,以便让其他坛友花最短的时间了解问题背景。这即可以节省他人的时间,也有助于自己尽快获取有用的反馈信息。
温馨提示: 文中链接在微信中无法生效。请点击底部
1. 问题描述
我们手头有如下面板数据(精简版):
+-----------------------------+
| id year nb1 nb2 x |
|-----------------------------|
| 1 2000 2 3 100 |
| 1 2001 2 3 110 |
| 1 2002 2 3 120 |
|-----------------------------|
| 2 2000 1 4 200 |
| 2 2001 1 4 210 |
| 2 2002 1 4 220 |
|-----------------------------|
| 3 2000 4 . 300 |
| 3 2001 4 . 310 |
| 3 2002 4 . 320 |
|-----------------------------|
| 4 2000 3 2 400 |
| 4 2001 3 2 410 |
| 4 2002 3 2 420 |
+-----------------------------+
该样本源于一个社区调查,共有四户居民,其中 id
为编号,year
为调查年份,nb1
为其邻居一 neighbor1
的 id
,nb2
为其邻居二 neighbor2
的编号。以第一个样本为例,其 nb1=2
,nb2=3
,说明第二户和第三户居民是其邻居。x
值是调查值,可以理解为收入。现在,我们需要做的工作就是,将样本对应的邻居的 x 值匹配到数据中来,即让样本找到其邻居的数据,来构造一个协变量。最终想要的结果如下:
+---------------------------------------------+
| id year nb1 nb2 x x_nb1 x_nb2 |
|---------------------------------------------|
| 1 2000 2 3 100 200 300 |
| 1 2001 2 3 110 210 310 |
| 1 2002 2 3 120 220 320 |
|---------------------------------------------|
| 2 2000 1 4 200 100 400 |
| 2 2001 1 4 210 110 410 |
| 2 2002 1 4 220 120 420 |
|---------------------------------------------|
| 3 2000 4 .