连享会 2019金秋十月-空间计量专题研讨班
1. 背景介绍
由于面板数据模型所具有的众多优点 (刻画个体异质性,减弱模型共线性和增加自由度等),其被广泛应用于实证计量中。在 「 Stata: 面板数据模型-一文读懂」 文中,我们已对面板数据模型进行了介绍。
然而,当研究样本涉及到多个单元时 (如多个国家),研究单元间的空间相关性不可忽略。例如,在利用跨国样本研究环境污染 (如 排放量) 的影响因素时,除考虑该国经济发展水平,人口总数,城市化水平和工业化水平等宏观变量之外,还应将其他研究单元的情况考虑在内,包括他国的环境污染程度 (后文纳入
的理论依据) 和宏观经济因素 (后文纳入
的理论依据)。理由如下:第一,由于污染的空间流动性,对于一些特定的污染物,本地区的污染水平会对其 “邻近” 地区的污染水平造成影响;第二,当某个地区的经济发展较快时,"邻近" 地区会模仿该地区的经济发展模式和产业布局,进而也会对其环境污染水平造成影响。
正如地理学第一定律 ( Tobler's First Law ) 所说:任何事物都是与其他事物相关的,只不过相近的事物关联更紧密。空间计量计量学的发展为这一理论研究提供了有力的工具。本推文将对面板数据框架下的空间计量模型 (空间面板数据模型) 进行讨论。本文主要分四部分内容进行介绍:
模型介绍: 空间面板模型简介
空间权重矩阵构造
模型解释
模型实现
2. 模型介绍: 空间面板模型简介
2.1 双向固定效应模型:不考虑空间相关性
在介绍空间面板模型之前,我们先简单回顾一下普通的面板数据模型。这里以双向固定效应模型为例进行说明,详情参见「 Stata: 面板数据模型-一文读懂」 。
面板数据模型同时包含了截面和时间两个维度,后文用 (
) 表示截面 (个体),
(
) 表示时间,设定如下面板数据模型:
其中,
为
因变量,
为
自变量,
为模型误差项,
是待估计参数,表示
对
的边际影响。
表示个体效应,表示那些不随时间改变的影响因素,如个人的消费习惯、企业文化和经营风格等;
表示时间效应,用于控制随时间改变因素的影响 (时间虚拟变量包括时间趋势项,时间趋势主要用于控制技术进步),如广告的投放 (往往通过电视或广播,我们可以认为在特定的年份所有个体所接受的广告投放量相同)。
显然, 和
在多数情况下都是无法直接观测或难以量化的,因此也就无法进入模型。在截面分析中往往会引起遗漏变量的问题。
面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。当对所有的 ,
均相等时,模型退化为混合数据模型 ( Pooled OLS ),可直接用
reg y x
命令进行参数估计。
2.2 空间面板数据模型
上述模型中解释变量仅仅纳入自身的因素,未考虑其他地区的一些因素。例如,一个国家的排放水平不仅与其"邻近"地区的
排放水平有关,还可能与其他地区的经济社会等因素存在关联。
空间面板数据模型进一步加入了空间滞后被解释变量 和空间滞后误差项
。前者称为空间滞后模型,后者称为空间误差模型。两类模型的主要区别在于刻画空间相依方式的不同,前者主要描述空间相依性 ( Spatial dependence ),后者描述空间异质性 ( Spatial heterogeneity )。进一步地,加入空间滞后解释变量
。考虑到模型的应用广泛性,本推文主要讨论同时纳入
和
的空间模型,该模型称为空间杜宾模型 ( Spatial Durbin model )。模型如下:
进一步,可将该模型写成向量形式:
其中, ;
;
是
的列向量,每个元素都为 1。
,
.
为空间权重矩阵,其合理定义是应用空间计量模型的一个关键前提。前文我们不厌其烦地多次提到"邻近"地区,
的一个作用就是用于某个地区的"邻近"地区包括哪些。此外,还可通过
定义邻近地区对本地区的影响方式和程度。
3. 空间权重矩阵构造
与普通面板数据模型相比,空间面板数据模型通过引入空间权重矩阵来定义研究单元之间的关联方式和关联程度。从现有文献来看,常用的空间权重矩阵可以归纳为两类。一类为基于地理位置构造的,如 Rook 、 Queen、K-nearest 和 距离倒数次方权重矩阵;一类为基于社会经济因素的空间权重矩阵。前者的优点为直观且满足空间权重矩阵外生性假定,而后者的优点为有较强的经济含义且更符合实际应用背景。基于社会经济因素的空间权重矩阵,由于不同年份的社会经济指标值不同,其通常是随着时间变化而改变,但是此时模型通常较为复杂,实证中常取平均值构造空间权重矩阵 (此外,时变空间权重矩阵也被提出)。
为了对模型进行正确识别,必须保证空间权重矩阵的外生性。基于经济社会因素构造的空间权重矩阵有时经济含义较为明显,但是通常都不满足外生性假设。因此,在实际应用中最常用的空间权重矩阵是基于地理信息或者地理位置的,如 Rook,Queen 以及距离权重矩阵。
3.1 Rook 和 Queen 权重矩阵
例如,在省域环境问题研究中,通常认为"邻近"省份的环境治理行为存在相似。这里的"邻近"可以认为从地理位置来看,两个省份存在地理接壤。若存在共同边界,元素设定为 1,否则设定为 0。假设我们有 5 个省份 (下文统称为 单元#),其地理分布如下图所示