stata 空间杜宾模型_空间面板数据模型及Stata实现

本文介绍了空间面板数据模型在Stata中的应用,特别是空间杜宾模型。文章首先回顾了普通面板数据模型,然后详细讨论了空间权重矩阵的构建,包括Rook和Queen权重矩阵、距离权重矩阵以及经济权重矩阵。接着,文章解释了空间面板数据模型的直接效应、间接效应和总效应,并展示了如何在Stata中使用xsmle命令进行估计。最后,提到了Moran指数的计算和地理分布图的绘制,以及模型稳健性检验的重要性。
摘要由CSDN通过智能技术生成

Note: 助教招聘信息请进入「课程主页」查看。因果推断-内生性 专题 ⌚ 2020.11.12-15 主讲:王存同 (中央财经大学);司继春(上海对外经贸大学)空间计量 专题 ⌚ 2020.12.10-13 主讲:杨海生 (中山大学);范巧 (兰州大学)

特别说明: 文中包含的链接在微信中无法生效。请点击本文底部左下角的【阅读原文】,转入本文【简书版】。图片来源:Golgher 和 Voss (2016)

连享会:分位数回归及Stata应用

直播时间:2020.4.21 (课程回放永久有效)

1. 背景介绍

由于面板数据模型所具有的众多优点 (刻画个体异质性,减弱模型共线性和增加自由度等),其被广泛应用于实证计量中。在 「 Stata: 面板数据模型-一文读懂」 文中,我们已对面板数据模型进行了介绍。

然而,当研究样本涉及到多个单元时 (如多个国家),研究单元间的空间相关性不可忽略。例如,在利用跨国样本研究环境污染 (如

排放量) 的影响因素时,除考虑该国经济发展水平,人口总数,城市化水平和工业化水平等宏观变量之外,还应将其他研究单元的情况考虑在内,包括他国的环境污染程度 (后文纳入 WY 的理论依据) 和宏观经济因素 (后文纳入 WX 的理论依据)。 理由如下:第一,由于污染的空间流动性,对于一些特定的污染物,本地区的污染水平会对其 “邻近” 地区的污染水平造成影响;第二,当某个地区的经济发展较快时,"邻近" 地区会模仿该地区的经济发展模式和产业布局,进而也会对其环境污染水平造成影响。

正如地理学第一定律 ( Tobler's First Law ) 所说:任何事物都是与其他事物相关的,只不过相近的事物关联更紧密。空间计量计量学的发展为这一理论研究提供了有力的工具。 本推文将对面板数据框架下的空间计量模型 (空间面板数据模型) 进行讨论。本文主要分四部分内容进行介绍:模型介绍: 空间面板模型简介

空间权重矩阵构造

模型解释

模型实现

2. 模型介绍: 空间面板模型简介

2.1 双向固定效应模型:不考虑空间相关性

在介绍空间面板模型之前,我们先简单回顾一下普通的面板数据模型。这里以双向固定效应模型为例进行说明,详情参见「 Stata: 面板数据模型-一文读懂」 。

面板数据模型同时包含了截面和时间两个维度,后文用 i (

) 表示截面 (个体),t (

) 表示时间,设定如下面板数据模型:

其中, -

因变量, -

自变量, -

为模型误差项,

是待估计参数,表示

的边际影响。 -

表示个体效应,表示那些不随时间改变的影响因素,如个人的消费习惯、企业文化和经营风格等; -

表示时间效应,用于控制随时间改变因素的影响 (时间虚拟变量包括时间趋势项,时间趋势主要用于控制技术进步),如广告的投放 (往往通过电视或广播,我们可以认为在特定的年份所有个体所接受的广告投放量相同)。

显然,

在多数情况下都是无法直接观测或难以量化的,因此也就无法进入模型。在截面分析中往往会引起遗漏变量的问题。

面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。当对所有的 i,

均相等时,模型退化为混合数据模型 ( Pooled OLS ),可直接用 reg y x 命令进行参数估计。

2.2 空间面板数据模型

上述模型中解释变量仅仅纳入自身的因素,未考虑其他地区的一些因素。例如,一个国家的

排放水平不仅与其"邻近"地区的

排放水平有关,还可能与其他地区的经济社会等因素存在关联。

空间面板数据模型进一步加入了空间滞后被解释变量 WY 和空间滞后误差项

。前者称为空间滞后模型,后者称为空间误差模型。两类模型的主要区别在于刻画空间相依方式的不同,前者主要描述空间相依性 ( Spatial dependence ),后者描述空间异质性 ( Spatial heterogeneity )。 进一步地,加入空间滞后解释变量 WX。考虑到模型的应用广泛性,本推文主要讨论同时纳入 WY 和 WX 的空间模型,该模型称为空间杜宾模型 ( Spatial Durbin model )。模型如下:

进一步,可将该模型写成向量形式:

其中,

;

;

的列向量,每个元素都为 1。

W 为空间权重矩阵,其合理定义是应用空间计量模型的一个关键前提。前文我们不厌其烦地多次提到"邻近"地区,W 的一个作用就是用于某个地区的"邻近"地区包括哪些。此外,还可通过 W 定义邻近地区对本地区的影响方式和程度。

3. 空间权重矩阵构造

与普通面板数据模型相比,空间面板数据模型通过引入空间权重矩阵来定义研究单元之间的关联方式和关联程度。从现有文献来看,常用的空间权重矩阵可以归纳为两类。一类为基于地理位置构造的,如 Rook 、 Queen、K-nearest 和 距离倒数次方权重矩阵;一类为基于社会经济因素的空间权重矩阵。前者的优点为直观且满足空间权重矩阵外生性假定,而后者的优点为有较强的经济含义且更符合实际应用背景。基于社会经济因素的空间权重矩阵,由于不同年份的社会经济指标值不同,其通常是随着时间变化而改变,但是此时模型通常较为复杂,实证中常取平均值构造空间权重矩阵 (此外,时变空间权重矩阵也被提出)。

为了对模型进行正确识别,必须保证空间权重矩阵的外生性。基于经济社会因素构造的空间权重矩阵有时经济含义较为明显,但是通常都不满足外生性假设。因此,在实际应用中最常用的空间权重矩阵是基于地理信息或者地理位置的,如 Rook,Queen 以及距离权重矩阵。

3.1 Rook 和 Queen 权重矩阵

例如,在省域环境问题研究中,通常认为"邻近"省份的环境治理行为存在相似。这里的"邻近"可以认为从地理位置来看,两个省份存在地理接壤。若存在共同边界,元素设定为 1,否则设定为 0。假设我们有 5 个省份 (下文统称为 单元#),其地理分布如下图所示

则 Rook 空间权重矩阵是一个 5 行 5 列的方阵:

具体解释如下: -

矩阵的对角线元素均为 0。这很显然。否则的话,你怎么解释 “我自己和自己相邻” 呢? -

矩阵的第一行表示 单元1 与各个单元之间的相邻关系。以第一行第二列为例,

,表示 单元1 与 单元2 相邻。按此逻辑,我们很容易猜知

。 - 细心的读者可以看出,在上例中,单元5 与其他单元都不存在共同边界,导致

矩阵的第 5 行元素的值全部为 0。例如,在我国省域单元研究中,海南省就是这样的情况。Rook 空间权重矩阵的设定不允许出现这种情况。因此,在实际分析中,若利用 Rook 空间权重矩阵,通常假设海南省与广东省存在相邻。

对于这种 孤零零的单元,另一种处理办法是放宽假设,可以认为只要存在顶点相接,就认为两地区为"邻居"关系,这就是 Queen 空间权重矩阵。按照这一设定,空间权重矩阵可定义为

3.2 距离权重矩阵

前文已经提及,空间权重矩阵不仅可以定义 关联方式 (是否关联),而且可以定义 关联程度 (关联的紧密程度)。然而基于 Rook 和 Queen 的空间权重矩阵假定两个地区只要存在关联,其关联程度都是相同的 (等权重)。然而,这种假定往往有悖常理。例如,在环境污染研究中,一般认为距离近的地区,关联程度较高;又如,在国际贸易研究中,往来密切的地区之间关联程度较高。在这种情况下,基于空间距离的权重矩阵较为合适。基于距离的空间权重矩阵定义如下:

其中:

分别表示某个国家 (如最大城市或首都) 的纬度和经度;

为两个国家间经度之差;R为地球半径,等于 3958.761英里。在实际应用中,常对空间权重矩阵进行行标准化,空间权重矩阵的对角元素设为 0。

3.3 经济权重矩阵

与基于地理信息构造的空间权重矩阵相比,经济权重矩阵的实际应

  • 3
    点赞
  • 54
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值