rdd 内生分组_内生性问题和倾向得分匹配, 献给准自然试验的厚礼

最新推荐文章于 2022-12-10 00:19:25 发布

weixin_39614675

最新推荐文章于 2022-12-10 00:19:25 发布

阅读量1.9k

点赞数

文章标签： rdd 内生分组

本文链接：https://blog.csdn.net/weixin_39614675/article/details/111483052

版权

欢迎投稿(荐稿)计量经济圈，计量相关都行

邮箱：econometrics666@sina.cn

编辑: @计量经济圈(ID: econometrics666); 来源: 统计学和量化研究公众号; 感谢授权。

1.PSM-DID, DID, RDD, Stata程序百科全书式的宝典

2.PSM倾向匹配Stata操作详细步骤和代码，干货十足

3.倾向匹配分析深度(Propsensity matching analysis)

说起内生性问题，通常大家都会有一个直观的印象：误差项(e)和解释变量抑或被解释变量有着纠缠不清的关系，Cov(Xi,e)≠0，Covermark(Y，e)≠0。在以往的文章中，对内生性问题也做过简单的介绍。那么，内生性问题到底是怎么出现的呢？有几类？

Part I 内生性问题浅谈

问题来源：测量与学科分歧

其实呢，内生性与观测性数据(observational data)的出现有很大关系，也就是“测量(measurement)”的问题，如何得到关于总体/样本的更为精确的测量数据。这是一个很久远的故事了。故事中有两个主角：第一个是很久以前的社会科学，主要是经济学吧。在数十年前还没有实现数理化，当时的学术研究呢，主要是基于一些理论性的推导或者理论模型的构建，实现形式模型的演进。而伴随着二战后的社科发展，经济学从宏观到微观，开始有了各种各样的数据，从宏观到微观，开始有了对模型加以检验的数据。这个需求也促使了社会科学的研究与应用统计的结合与进一步发展。这种结合事实上推动了两个学科的大发展，从理论和实践上都有丰硕的成果。(当然，此处应有参考文献，围笑.jpg)社会科学中对测量的讨论也是非常多的，最具代表性的，当属Otis Duncan的 Notes on Social Measurement。推荐阅读。里面介绍了关于“异质性”的若干讨论。

另一个主角呢，不得不说，是自然科学的。限定一下主语，是自然科学中的医学统计学、生物统计学和流行病学等几种用统计方法较多的学科。由于不同学科的人对其他非本学科的研究通常会怀持有怀疑态度，学科交流也相对较少，尤其是跨文理科的那种交流。这种隔阂的形成自有其道理，毕竟不同学科有自己的方法论根基。

回到主题。事实上，医学统计和流行病学方法与社会科学方法论相似度可以说高达百分之九十以上(纯属主观臆测，没有事实根据，请轻拍)。我们的应用研究无外乎就是用了一些统计学的皮毛来处理实际的问题。我们都需要遵守研究的伦理，都需要从一些基本的问题出发，收集数据，然后利用一些统计的原理，比如回归模型、统计分布、假设检验等等，最后再回到问题。

2.随机对照试验与反事实推断

讲一下区别吧。这个区别就来源于数据的获得，是否是通过实验获得。数据获得有一个“金标准”，随机对照试验(Randomized Comparative Test，即RCT)。这个方法来自于统计学家Fisher，他在20世纪30年代通过随机试验创立了此方法。

事实上，基于自然科学的研究得到的数据多是实验法得到的，实验方法有很多种，通常会设计精致的研究，有参照组和实验组，有明确的前测和后测。通过对时间的把握，来记录实验效果，这个实验也是可以多次重复多次检验。这个过程也保证了研究中对于参照组的控制，对时间效应的控制，对研究者效应的控制，以及对自身变化的内生因素及其它突发事件等外生因素的控制。因为这几个部分通常是最主要的研究偏误(bias)的来源，控制好了才能表明这个研究是相对精确的、严谨的。社会科学呢，采用更多的是观测性数据，也就是通常所说的“横截面数据”。一般都是选取某个时间节点，然后横向切割一下，通过对若干大样本的观察和记录指标，完成对样本的刻画。所以，这种数据通常都是“静态”的，不能进行“实验”的。也就意味着，这样会有更多的方法论问题出现。这些年，随着社会科学研究的发展，出现了诸多的追踪数据(panel data)，在一定程度上已经可以解决，或者规避某种方法论问题了。但要达到实验研究的精度，确实是不可能的。而且，即便是追踪调查，也不可能做到非常及时的观测和记录，仍然受制于特别多的现实因素。

例如，对某种药物效果的医学研究，通常会设置实验组和若干参照组，通过“干预Treat”研究对象，看这种药物是否有效。然后进一步，再测量不同剂量(dosage)的反应。由于它研究的若干案例就是总体，所以可以不用考虑再另外去“推断总体”的问题了。但随着研究的拓展，流行病学研究中，也开始涉足某些大样本的问题。比如，针对某种地方病的研究，我们在某个地区，设计一个抽样框，抽取了10000个样本，这个过程就涉及到了“推断”，也就面临了更多的方法论的问题。

这些问题也就是社会科学研究常常见到的问题：观测数据的反事实推断。在这里，我图省事，引用一段论文：“微观数据有两个基本特征:异质性以及缺少与实际相反的状况。由于存在未被观测到的异质性, 即使在所有可以被观测到的方面都相同的人们仍然会做出不同的决策、获得不同的收入、选择不同的投资组合。缺少与实际相反的状况引发了数据缺失问题, 如果某人实际选择了一种状况, 我们就不可能观测到他(她)做出其他选择时的结果。如果我们观测到某大学毕业生的当前收入水平, 我们就不可能同时观测到假使他(她)高中毕业就参加工作的当前收入水平。”(Li & Heckman, 2004)这段表述非常清晰地表明了反事实推断是怎么回事，以及横截面数据为什么做不好反事实推断。同样，我们可以举出很多例子来：是否参与了某个培训项目、通过某个职业资格考试，对于同一个就业队列的个体收入的影响；是否接受过高等教育，对于个体收入的影响等等。更加具体的介绍不做赘述。