你是否经常使用观测数据或非实验数据?你是否在面对数据带来的自选择偏误时束手无策?今天,商小研就要给大家介绍一种可以用来缓解自选择偏误的计量方法——倾向得分匹配法!
01 倾向得分匹配法是什么
倾向得分匹配法(Propensity Score Matching)一般简称为“PSM”,是当前经济学界用来处理自选择偏误的一大热门利器,它经常和之前我们介绍过的双重差分法(DID)进行组合使用(PSM-DID),这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出。
02 倾向得分匹配法的逻辑和原理
我们举个简单常用的例子来说明PSM的原理。我们现在想要研究“接受某种职业技能培训会对个人收入有怎么样的影响”这一课题,我们收集到的是观测数据,将其简单分为处理组(接受培训)和控制组(未接受培训)。如果由此直接计算接受培训带来的处理效应(treatment effect),那显然得到的结果是不可信的。
![d6ae19960ad740e07a37bc0da6d9add2.png](https://i-blog.csdnimg.cn/blog_migrate/fb09b45581d40c350b2e475f7b19f108.png)
显然,存在着这样一个协变量集Xi,Xi中的变量均会对Y和X1产生影响。比如个人的能力,个人能力强的人可能就不会选择接受技能培训,但是能力强的人又能取得比较高的收入,这可能会对处理效应产生一个偏导性的影响。除了个人能力