合成控制方法学习：待更新_合成控制法书籍-CSDN博客

本文链接：https://blog.csdn.net/lim18719266191/article/details/133749335

基础理解：

在计量经济学中，对于政策评价的基本方法一般有三种：合成控制法，双重差分法（DID），断点回归。其中合成控制法和双重差分法十分相似，本质思想在于，找到一个对照组，对比处理组与对照组的异同，得出政策的效果评价。

在实验室中进行的实验，例如，生物细菌培养，实验基本条件是可控的，可以通过人为改变外在条件，达到对处理组和对照组的不同处理效果。但是对于地区政策评价时，找到一个地区的对照组是比较困难的。因为一旦对某地区实行了一种政策，就无法观测到这个地区未实施这种政策的状态。历史无法重演，无法回到过去，阻止此项政策的实施，来观察未实施政策的效果。合成控制法，双重差分法，都是基于寻找对照组的基本思想，评价实施政策的效果。

想要评价某政策对于A地区的作用，但是有找不到对照组（与A地区所有条件相同，但是未实施此政策），最为直接的办法是，用与A很相似的未实施此政策的地区，作为对照组。遗憾的是，我们并不能寻找到一个与A地区相似且为受到政策处理的地区，例如，我们评价房产税改革对上海市房价的影响，主观上，我们会觉得“北京、深圳”等地，和上海地区较为相似，但是这仅仅是我们的主观臆断，并不够严谨。还有一个重要的问题在于，即使我们选择了北京作为上海的对照组，北京市和上海市，也并不是高度相似的，显而易见，我们直接对比两地的房价变化，是十分不严谨的。上文我们谈到，在理想的实验室实验中，完全可以采用两个完全相同的培养皿，分为处理组和对照组，以此来研究处理对实验结果的效果影响。中学时期，这种基本的实验思想，我们都已经接触过，不再赘述。回到我们的双重差分法中，尽管我们使用的对照组——北京，与上海并不完全相同，我们是否可以使用某种方法，使得北京和上海，有可比性呢？我是指，使用某种方法，使得北京和上海在一定程度上是可比的。在这里为了方便，我们引入一个浅显的例子来作解释，某种营养品可以促进身高增长，哥哥和弟弟都想使用营养品促进身高增长，为了测试营养品是否有效果，决定弟弟先吃，观察是否有效，哥哥再吃。如果吃营养品之前，弟弟身高150cm，哥哥160cm。弟弟吃了营养品（假设除了营养品外，弟弟和哥哥其他生活条件基本相似），一年后，弟弟身高165cm，哥哥身高170cm，我们观察到，相同时间内，弟弟身高增长15cm，哥哥10cm。弟弟增长的速度明显比哥哥快，相同时间内多增长了5cm，这时我们是否可以肯定，营养品可以促使，每年身高增长5cm？显然是不能的，很多人可能会说，弟弟年龄小，原本就比哥哥增长速度更快，多出来的5cm，不一定是营养品的功劳。为了明确的知道，多出来的5cm，是否真的是营养品的功劳，我们需要知道一个前提——弟弟与哥哥身高增长的速度是不是一样的？显而易见，如果弟弟和哥哥的增长速度相同（都是每年10cm），那么可以确定，弟弟多增长的5cm来自于营养品的效应；如果弟弟与哥哥增长速度不同（弟弟快，或者哥哥快），那么营养品的效应也就无法确定。这个例子，指出了双重差分最为重要的前提假设——共同趋势（Common trend），即哥哥与弟弟身高的增长趋势相同时，我们才能对比其二者身高的变化。在这个例子中，弟弟为处理组，哥哥为对照组，政策处理是营养品，政策效果评价即为弟弟和哥哥的身高变化差异。我们可以清楚的知道，未吃营养品时（未实施政策时），弟弟与哥哥身高差距10cm，吃过营养品后（实施政策后），弟弟身高增长了15cm。假如弟弟和哥哥身高增长趋势相同（均为每年10cm），那么弟弟多增长的这5cm，就是来自于营养品（政策）的效果。

一年后弟弟的身高-一年前弟弟的身高=15cm（处理后与处理前之差，即第一次差分）

一年前哥哥的身高-一年前弟弟的身高=10cm（处理组与未处理组之差，即第二次差分）

这也正是双重差分法名字的由来，通过两次差分，我们可以得到营养品（政策）的实际效果，但是，需要注意，有一个重要的前提，哥哥（对照组）和弟弟（处理组）需要有相同的增长趋势。

双重差分法的缺点是显而易见的，在实际中，我们研究的弟弟（处理组）很可能是没有哥哥（合适的对照组）的，我们很难找到一个对照组（哥哥）和处理组（弟弟）外在条件相似，而且有相同的趋势。很多时候，我们并没有一个哥哥（对照组）来做对比，研究弟弟（处理组）的时候，很可能只能用邻居家的孩子来做对照组，那样的话，二者的外在条件（饮食习惯）将不再相似，研究也就不够严谨。在北京和上海的对比中，我们选取北京作为对照组，仅仅是我们的主观判断，我们无法严谨的证明，北京和上海外在条件相似以及具有共同趋势。那样的话，整个实验将缺乏严谨性，对政策效果的评价也难免有失偏颇。而合成控制法就严谨很多。

继续上个例子来谈，如果我们研究的弟弟（处理组），并没有哥哥（合适的对照组）时，双重差分将不再严谨。此时，我们可以使用合成控制法，合成一个虚拟的弟弟（对照组），与真实的弟弟（处理组）做对比。假如弟弟所住的村子，所有人的饮食习惯、基因差距不大，可以使用所有邻居家的孩子合成一个虚拟的弟弟，在吃营养品（政策）之前，通过线性加权，使得合成的虚拟弟弟，与真实的弟弟身高增长曲线，完全一致。吃了营养品之后，如果营养品存在效果，真实弟弟的身高，将会比原来预计的身高（虚拟弟弟的身高），高很多。这样，我们便可以得到政策对于结果的影响有多大。

假设我们研究的弟弟的一段时间（政策处理之前）的身高序列构成向量α，邻居家小孩的身高序列构成矩阵A，理论上，我们只需要寻找一个权重向量γ，使得Aγ≈α，就可以确定的构造虚拟对照组。这里使用“≈”，并不是一个正式的表述，只是为了便于理解。一旦我们找到了权重向量γ，就可以使用邻家小孩的全部时间段（即政策处理前和政策处理后）的身高信息来合成一个虚拟的弟弟。对比虚拟弟弟的和真实弟弟处理后的身高，可以得到，营养品（政策处理）的效果。

合成控制法对比双重差分法的严谨性，是显而易见的：

首先，合成控制法的对照组并不来自于研究者的主观臆断，而是使用数学方法的加权组合，它给予了多数未处理的对照地区，对虚拟合成地区贡献的机会，避免了研究者的主观选择对照组的缺陷。
但合成控制法，同样存在很大的缺陷，比如因为它使用加权的方法合成虚拟对照组，很大程度上，不能合成“极值”的虚拟对照组。试想一个孩子，在村子里显著的比其他孩子都要更高，使用其他所有孩子的身高信息来合成最高孩子的虚拟对照组是不可能的，这一点，我们可以从，刘甲炎、范子英（2013）对上海和重庆的房产税试点研究中窥见一二。
因为上海的特殊经济特征，其在全国的所有城市中，属于“极值”，研究者发现，合成控制法不能合成上海市的虚拟对照组。
刘友金、曾小明（2018）在研究房产税对产业转移的影响中，使用合成控制法评价重庆的房产税效果，而对于不能使用合成控制法的上海，使用了双重差分法。

在实际研究中，我们不能简单的局限于一种方法，不能死板，应当看到不同方法背后的内涵和原理，实现灵活运用的效果，最终达到我们的研究目的。