将列向量合成矩阵_政策效应评估:合成控制法(一)

8b3a10e6aca85abf26746edad01ee7f2.png点击上方“蓝字”关注我们吧!

559179f91d49a0b6de217e37021e753e.gif

Abadie and Gardeazabal (2003)提出“合成控制法”(Synthetic Control Method),用来研究西班牙巴斯克地区(Basque country)恐怖活动的经济成本(AER,2003)。

Abadie, Diamond, and Hainmueller (2010)首次证明了合成控制法的基本性质,并将其应用于研究美国加州1988年第99号控烟法(Proposition 99)的效果(JASA,2010)。

这也是两个比较典型的合成控制法的应用案例。

本篇文章,我们首先介绍合成控制法的基本估计思想。

0 1背景

Alberto Abadie是MIT经济系教授,其此前长期任教于哈佛大学肯尼迪学院,来自于毗邻法国的西班牙自治地区巴斯克地区。

在1970年代初,巴斯克地区的人均GDP在西班牙17个地区中排第三。之后,由于民族独立的诉求未获满足,从1975年开始,巴斯克地区陷入有组织的恐怖活动之中。恐怖活动重创巴斯克经济,至1990年代末,巴斯克地区的人均GDP在西班牙排名降为第六。

为此,Abadie and Gardeazabal (2003)想衡量西班牙巴斯克地区(Basque country)恐怖活动的经济成本。

我们可以设想:要得到西班牙巴斯克地区恐怖活动的经济成本,则需要测算西班牙巴斯克地区未发生恐怖活动时的经济发展状况(未知状态),进而与发生恐怖活动后的经济状况(现实状态)进行对比。而发生恐怖活动时的经济发展状况是未知的,也正是我们需要测度的。

那么,怎么测度西班牙巴斯克地区未发生恐怖活动时的经济发展状况呢?

基本思想为:

使用西班牙未发生恐怖活动的其他地区(控制组)的线性组合来构造合成的巴斯克地区(处置组),以使得合成地区的经济特征与60年代末发生恐怖活动的巴斯克地区尽可能相似。实际相当于基于控制组模拟一个假想的巴斯克。然后,用合成的巴斯克地区的经济发展状况来拟合未发生恐怖活动时的巴斯克地区的经济状况“,并将合成巴斯克地区(synthetic )的人均GDP演化与真实巴斯克地区(actual )进行对比,两者的差异即为班牙巴斯克地区(Basque country)恐怖活动的经济成本。不过,前提是,合成的巴斯克地区要“足够理想”,也就是说假的巴斯克要足够逼真。

这便是合成控制法提出的背景。

0 2估计思想0 1情景设定

假设共有(1+J )个个体,政策干预时间为T0其中第1个个体为受到政策影响的个体,即处置个体,而其余J个个体为不受政策影响的个体,即潜在的控制组(称为“donor pool”)。一个潜在假定是,政策干预仅影响处置个体,而未波及控制组个体。

结果变量(被解释变量,研究变量)为 y ,影响 y 的解释变量或预测变量(predictors)为x(k维矩阵),包括k个解释变量。

处置个体的各预测变量(解释变量)的平均值为向量 X1 (× 1 维列向量,下标1表示“treated region”)。而其他控制组的预测变量的平均值记为矩阵 X0(k× 维矩阵,下标0表示“control region”),其中第 j 列为第 j 个控制个体的相应取值。

那么,基于合成控制法来评估个体1受政策干预的效应,即为通过控制组的X0合成处置个体的X1,通过控制组的y0合处置个体的 y1 。而合成的过程是通过设定并估计一个权重矩阵,通过求解二次规划问题实现的。

0 2合成控制

假设用于合成处置个体的控制组各个体的权重为J 维列向量W

db6d538e86e8ee9016253f39a45a4e28.png

其中,W2 表示第2个个体在合成处置个体时所占的权重,以此类推。所有权重非负且和为1W的不同取值即构成不同的合成控制个体,简称“合成控制”(synthetic control)。

若存在权重 W,使得 X0尽可能地接近于 X1,则意味着经过加权之后,基于控制组合成的经济特征尽量接近了处理个体的经济特征。也就是说,模拟的处置个体足够接近真实的处置个体。→这个非常重要!

如何使基于控制组合成的经济特征尽量接近了处理个体的经济特征呢?

——自然是X0与 X1的距离尽可能小了(有没有觉得很熟悉?)。

为了实现这一条件,可考虑使用二次型 (类似于欧几里得空间中两点之间的距离)。由于 X1 中的每个预测变量对于 y 的预测能力有大小之别,应在距离函数中享有不同的权重,故考虑以下带约束的最小化问题:

eef9ab7dc7bbafca8f278e619d141bb6.png (1)

其中,V 为维对角矩阵,对角线元素均为非负权重,反映相应的预测变量对于结果变量的相对重要性。

显然,此约束最小化问题的最优解依赖于对角矩阵 V,记为 W*(V)。

进一步,选择最优的 V,使得政策干预之前,合成的处置个体的结果变量(y)与真实处置个体的结果变量尽量接近。

具体而言,记 z为 (T0 × 1) 维列向量,表示处置个体在政策干预前的结果变量;记 Z0为 (T0 × J ) 维矩阵,其中每列为相应控制个体在政策干预前的结果变量。

那么,选择V用 Z0W*(V) (基于权重WZ0的线性组合)来预测 z1,以最小化合成的“均方预测误差”(Mean Squared Prediction Error,简记MSPE),即将每期的预测误差平方后再求各期的平均: 

b755d68c47c376372b468e9803009a81.png(2)

求解此最小化问题,可得构成合成处置个体的最优权重,W* = W*(V*)。

也就是说,合成控制法通过实现式(1)、式(2)、使基于控制组合成的处置个体的预测变量、结果变量都尽可能接近处置个体的真实情况。而怎么尽可能接近,还是借助的计算距离或均方误差的思想。

0 3合成控制法的思想小结

总结而言,合成控制法的思想为:

基于控制组的解释变量合成处置个体的解释变量,以构建(合成)与处置个体经济状态尽量相似的经济状态【理想的对照组】。同时,基于控制组的被解释变量合成政策干预前的处置个体的被解释变量,以体现政策干预前合成(拟合)的程度【理想的拟合】。这个过程是通过求解控制组不同个体在合成中的权重w*(V*)来解决的。进而,合成政策干预之后处置个体在不受政策影响下的潜在路径,并与现实路径进行对比,便可得到处置个体的政策效应啦。

是不是很简单,也很容易理解?

合成控制法的思想确实很简单。也正因此,合成控制法是目前政策效应评估的有效工具,从而在社会经济领域的pprogram evaluation中得到了广泛的应用。

关于合成控制法的计量模型设定、估计的stata命令、合成控制法的局限性等,我们下次再讨论。

未完待续……

551d6cc1728c3d5e82aa1dfec4ee5581.png

9e1d3524933be9affbfc500b467afc29.png

5fe6f6b67f6250d5c9fbf4684ade0ee6.png c4ac0c71977281abb8e86b3c2f93fe06.gif 扫描关注我们, 一起来充电吧!
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值