stata中计算公式命令_Stata: 工具变量法 (IV) 也不难呀!

NEW!连享会·推文专辑:
Stata资源 | 数据处理 | Stata绘图 | Stata程序
结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据
交乘调节 | DID | RDD  |  因果推断 |  SFA-TFP-DEA
文本分析+爬虫 | 空间计量 | 学术论文 | 软件工具

连享会学习群-常见问题解答汇总:
?  WD 主页: https://gitee.com/arlionn/WD

? 连享会主页:lianxh.cn

c75fe06aac6c10dcf188525fb17d43fb.png
Stata 暑期班:9天直播

? 时间:2020.7.28-8.7
? 嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
? 主页:https://gitee.com/arlionn/PX  | ? 微信版

  「基础不牢,地动山摇……」

d7b5ecaf0bd8c0a5d36a719c5bd6855d.png

彩蛋:现在报名「Stata暑期全程班」即可获赠 Stata Logo T恤一件,好拉风!

ee7ed87e8ce0b5060df089eab7622ef6.png

作者:杨柳 (西北大学),连玉君 (中山大学)E-Mail: philoyl@163.com,arlionn@163.com


目录

  • 1. IV 估计法的基本思想

  • 2.  IV 估计式

  • 3. 2SLS

    • 3.1 2SLS 原理

    • 3.2 应用 Stata 计算示例

  • 参考文献


王小二参加研究生复试的面试时,恰好认识其中一位参加面试的老师。假设面试分数 () 由面试老师 () 决定,王小二可视为随机误差项 ,认识王小二的那位面试老师可视为内生的解释变量 ,如果让这位老师继续参加面试给王小二打分,那么面试分数就很可能偏高。如何解决这个内生性问题呢?不妨再找另一个老师来代替这位跟王小二认识的老师,基本要求是:新找来的老师不能跟王小二认识,并且又跟被替换下的这位老师在专业背景方面有很高的相似度。这个新找来的老师就称为被替换下的老师的工具变量 (Instrumental Variable,简称 IV) 。接下来,让我们一起学习 IV 估计。

1. IV 估计法的基本思想

我们从一个最简单的回归模型引入工具变量估计法。如下式(1)所示:

假设 度量的是收入, 度量的是受教育的年数, 为随机误差项。简单回归模型(1)假设 与随机误差项 不相关。 对 的唯一直接影响是通过 带来的,如下图(1)所示:

c10f4e69ec4e0ca107b0722d0fd5f0ea.png
图1 简单回归模型x对y的直接影响

随机误差项 包括了除受教育年数之外的所有其他未观测到的影响收入的因素,能力 的因素包括在 中,因为 能力 的高低与 收入 () 具有相关性(一般的,能力高的人收入会高)。但同时 能力 的高低与 受教育年数 () 也具有相关性(一般的,能力高的人倾向于接受更多的教育或技能培训),如下图(2)所示:

3a2f2207cbf338bc7c86eb087d988d2e.png
图2 误差项与x相关

在模型(1)中我们遗漏了 能力 这个重要变量,在这种情况下,OLS 估计量 就不是 的一致估计量,因为 包括了两部分的影响效果:一部分 是我们期望得到的受教育年数对收入的直接影响,另一部分 是来自于能力的间接影响,例如,能力高的人通常会有较高的受教育年数,从而有较高的收入。如果受教育时间增加 1 年与年收入增加 1,000 美元相关,我们就不能确定增加的 1,000 美元当中有多少是来自于 受教育年数多的影响,有多少是来自于 能力高 的影响。

我们可以使用工具变量估计法解决上述内生性问题。引入一个新的工具变量 ,它具有以下性质: 的变化与 的变化相关;除了 会间接的通过影响 来影响 之外, 的变化不会导致 的变化。例如,与大学相邻 () 可能会决定是否上大学,从而影响受教育年数 (),但并不直接决定收入 ()。如下图三所示:

6eb8f345f3f3943ba5d12d498b8eaeaa.png
图3 工具变量z的影响效果的图示

当 的工具变量 满足以下条件时,IV 估计量 是一致估计量: (1) 与 相关; (2) 与 不相关。

2.  IV 估计式

在一般形式的回归模型(2)中(以矩阵形式表示):

是由解释变量构成的 维矩阵, 是系数向量。定义一个矩阵 与 有着相同的维度,作为 的工具变量,将(2)式两端同乘以矩阵 ,则有:

工具变量 与 不相关,意味着当 趋于无穷大时 的概率极限为 0。因此,我们可以从下式中定义出 IV 估计量 :

IV 估计量的一种有趣的情况是:如果零条件均值假设满足,每一个解释变量都可以做为自己的工具变量,即 ,此时,IV 估计量就缩减为 OLS 估计量。因此,当零条件均值假设满足时,OLS 估计量是 IV 估计量的一种特殊情形。

3. 2SLS

如果 "王小二面试" 时找来一个代替老师,那么这位新老师给的面试分数还是有一定的随机性,一个主要的原因是新找来的这位老师可能与被替换的那位老师之间的相关性不够强。为了控制面试得分偏差,我们可以多找几个老师。不妨找三个老师,这三个老师就称为被替换下来的老师的三个工具变量。此时,我们会面临一个问题:回归模型中有一个内生变量,并且我们找了多个工具变量,不妨设为 ,

  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值