? 连享会主页:lianxh.cn
? 连享会 · 因果推断-内生性 专题
⌚ 2020.11.12-15? 主讲:王存同 (中央财经大学);司继春(上海对外经贸大学)
? 课程主页:https://gitee.com/arlionn/YG
? 诚邀助教 10 名,详见课程主页。
作者: 陈贤孟 (厦门大学)邮箱: cxminjnu@163.com
温馨提示: 文中链接在微信中无法生效。请点击底部
[编者按]: 本文介绍的内容来自如下论文,特此致谢!
[Source]: Lee, Y. J., & Wilhelm, D. (2020). Testing for the presence of measurement error in Stata. The Stata Journal, 20(2), 382-404. -Link-
目录
1. 引言
2. 检验测量误差的参数方法
2.1 基本原理
2.2 简单示例
3. 检验测量误差的非参数方法
3.1 基本原理
3.2 dgmtest 命令介绍
3.3 简单示例
4. 蒙特卡罗模拟
4.1 蒙特卡罗模拟设计
4.2 蒙特卡罗模拟结果呈现
5. 应用实例
5.1 实例背景介绍
5.2 检验过程介绍与结果呈现
6. 总结
7. 参考文献
1. 引言
「测量误差」 (Measurement Error,也称为「衡量偏误」) 是内生性的主要来源之一。相对于另外两种文献中经常提及的内生性来源——「遗漏变量」、「互为因果」,大家对「测量误差」的关注非常有限。在实证研究过程中,若解释变量存在测量误差,往往会使得研究者无法一致地估计解释变量的系数。那们如何判断解释变量是否存在测量误差?
Lee and Wilhelm (2020) 系统介绍如何运用 Stata 检验解释变量的测量误差。
- 首先,构建如下检验假设:
其中, 表示解释变量的观测值, 表示解释变量的真实值。
- 然后,他们又分别通过「参数方法」和「非参数方法」对上述假设进行检验。
接下来,我们将对上述两种检验方法进行详细介绍。
2. 检验测量误差的参数方法
2.1 基本原理
首先,考虑以下的一元线性回归模型:
通常,我们无法直接观测到真实值 ,故会使用观测值 作为真实值 的度量。为检验 是否存在测量误差,我们需要找到一个合适的工具变量 (满足外生性条件和相关性条件)。
Hausman (1978) 指出,若不存在测量误差,OLS 估计量和 IV 估计量均是一致的,反之,则仅有 IV 估计量是一致的。因此,我们可以将 OLS 估计量和 IV 估计量进行对比,若 IV 估计量和 OLS 估计量存在显著差异,则解释变量存在测量误差。
在实践中,一种常见的等价做法是,对如下方程进行回归,并检验工具变量 的系数 是否显著为 0,以判断解释变量是否存在测量误差,具体如下:
Lee and Wilhelm (2020) 指出,当式 (2) 成立时,拒绝假设 (4) 等价于拒绝假设 (1),表明解释变量存在测量误差问题。反之,则不成立,即无法拒绝假设 (4) 并不意味着解释变量不存在测量误差。为了让上述两个假设完全等价,需进一步作出如下限定:
- 记 ,其中 表示 的测量误差,并且 满足 和 。这里的 又被称为「经典测量误差」。
2.2 简单示例
接下来,我们将通过一个模拟的例子来说明如何用参数方法检验解释变量的测量误差。
*-设定样本量为200,同时设置随机数种子
clear all
set obs 200
set seed 982
*-用随机数生成变量x、y、z和扰动项u和e
generate double z = rnormal(0,1)
generate double u = rnormal(0,0.5)
generate double e = rnormal(0,0.5)
generate xs = 0.5*z + u
generate x = xs //没有测量误