处理效应模型stata实例_Stata手动:各类匹配方法大全 A——理论篇

本文介绍了处理效应模型中常见的匹配方法,包括精确匹配、粗糙精确匹配、k-近邻匹配、半径匹配、多变量匹配如欧氏距离、马氏距离和百分等级匹配,以及倾向得分匹配。通过Stata模拟,对比了不同匹配方法的优劣,以帮助理解和应用这些方法。
摘要由CSDN通过智能技术生成

Stata 连享会   主页 || 视频 || 推文温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

✌ 作者:黄俊凯 (中国人民大学)

E-Mail: kopanswer@126.com

Note: 助教招聘信息请进入「课程主页」查看。因果推断-内生性 专题 ⌚ 2020.11.12-15

主讲:王存同 (中央财经大学);司继春(上海对外经贸大学)

课程主页:https://gitee.com/arlionn/YG | 微信版空间计量 专题 ⌚ 2020.12.10-13

主讲:杨海生 (中山大学);范巧 (兰州大学)

课程主页:https://gitee.com/arlionn/SP | 微信版

目录

匹配是研究处理效应的常见工具,本文总结了常见的匹配方法,并在第三部分给出 Stata 模拟以比较不同的匹配方法的优劣。

1. 单变量匹配 uni-variate match

单变量匹配的方法有精确匹配、粗糙精确匹配,k-近邻匹配和半径 (卡尺) 匹配。

1.1 精确匹配 exact match

顾名思义,当且仅当两个观测值的匹配变量相等时匹配成功。

1.2 粗糙精确匹配 coarsened exact match

粗糙精确匹配用途广泛,通常要求匹配变量是分类变量。比如公司金融中同行业的公司,又比如教育经济学中在同一个班的同学。粗糙精确匹配可以轻松的推广到多变量匹配的情形,如同行业同年度的公司,同班同性别的同学。

1.3 k-近邻匹配 k-nearest neighbor match

k-近邻匹配要求匹配变量是距离,它选取距离最近的 k 个观测值作为对照组。

1.4 radius (caliper) match

k-近邻匹配要求匹配变量也是距离,它事先设定半径 (上下半径可以不同),找出设定范围内的全部观测值作为对照组。显然,随着半径的降低,匹配要求也更趋严格。

2. 多变量匹配 multi-variate match

多变量匹配的核心思路是降维 (dimension reduction),将多变量降维为距离或得分,然后再运用单变量匹配的方法。多变量匹配的方法有欧氏距离、百分等级、马氏距离和倾向得分匹配等。

为能直观的图示,下文全部示例仅考虑双变量 (平面) 的情形。

2.1 欧氏距离匹配 euclidean distance match

最简单的测度空间就是欧氏距离空间。你可以轻松的用尺子直接量出点到原点、或任意两点之间的距离。

平面上任意点

到原点的距离公式为:

平面上任意两点

之间的距离公式为:

在欧式距离空间中,坐标轴之间是相互垂直的,也就意味着随机变量之间的相关系数为零。这是一个非常强的假设,而实际研究中该假设往往不能成立。比如研究一个人的健康时,作为影响因素的身高和体重之间往往是正相关的。

在欧式距离空间中,坐标轴上的量纲也是默认相同的,也就意味着随机变量必须有相同的量纲。这同样是一个过于严苛的假设。同样是研究一个人的健康,身高的单位是厘米,体重的单位是公斤,无论如何长度单位和重量单位是不可比的。

2.2 马氏距离匹配 mahalanobis distance match

为了克服匹配时欧氏距离空间的上述两个缺陷,印度数学家 Mahalanobis 提出了著名的马氏距离空间。马氏距离对多匹配变量的联合分布的位置、形状做了标准化调整,也对多匹配变量之间的相关性做了正交化调整,从而将多匹配变量的联合分布转变为可以用欧氏距离计算的情形。

马氏距离实现上述功能的关键在于用协方差矩阵的逆矩阵做了调整。我们将在第三部分用 Stata 代码逐步展示它。任意点

到质心 (centroid)

的距离公式如下:

任意两点

之间的距离公式如下:

其中

为多维随机变量的样本协方差矩阵,

是质心或样本均值。若样本协方差矩阵是单位矩阵 (各维度之间独立同部分),马氏距离退化为欧氏距离。

马氏距离测量相对于质心的距离,质心是一个基准点或中

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值