动态面板模型与R

泥壶映雪

已于 2022-06-23 19:12:59 修改

阅读量3.4k

点赞数 6

分类专栏：计量经济学 R 文章标签：线性代数矩阵

于 2021-06-24 23:20:08 首次发布

本文链接：https://blog.csdn.net/weixin_46649908/article/details/118198377

版权

计量经济学同时被 2 个专栏收录

37 篇文章

订阅专栏

37 篇文章

订阅专栏

动态面板模型与R

文章目录

动态面板模型与R
@[toc]
1 动态面板模型
2 差分GMM
3 水平GMM
4 系统GMM
5 R操作

1 动态面板模型

含义：线性面板模型中含有被解释变量滞后项。例如
$y_{it} = \alpha+\rho y_{i,t-1}+\beta x_{it}+\mu_i+\varepsilon_{it}\tag{1}$
其中 $1,2,\dots N$ , $2,3\dots T$ ， $a$ 为常数， $\mu_i$ 为个体异质性， $\varepsilon$ 为扰动项， $\alpha$ 是常数项， $\rho$ 是被解释变量滞后系数； $\beta$ 为自变量， $\varepsilon_{it}$ 为白噪声。称（1)为动态面板数据模型(Dynamic Panel Data，简记DPD)。也称方程（1）为水平方程，即原始方程。显然 $Cov(y_{i,t-1},\mu_i)\ne0$ (无论被解释变量在时间上如何变化， $\mu_i$ 都是其组成部分)。如果按照静态面板的固定效应模型思路，即组内离差变换得到
$y_{i t}-\bar{y}_{i}=\rho\left(y_{i, t-1}-\overline{L y}_{i}\right)+\beta\left(x_{i t}-\bar{x}_{i}\right)+\left(\varepsilon_{i t}-\bar{\varepsilon}_{i}\right) \quad(t=2, \cdots, T)\tag{2}$
其中 $\bar{y}_{i} \equiv \frac{1}{T-1} \sum_{t=2}^{T} y_{i t}$ , $\overline{L y}_{i} = \frac{1}{T-1} \sum_{t=2}^{T} y_{i, t-1}$ , $\bar{\varepsilon}_{i} = \frac{1}{T-1} \sum_{t=2}^{T} {\varepsilon}_{i t}$ 。因此 $Cov(\left(y_{i, t-1}-\overline{L y}_{i}\right),\left(\varepsilon_{i t}-\bar{\varepsilon}_{i}\right) )\ne 0$ ，故组内离差变换仍然存在固有的内生性，将这种内生性称为动态面板偏差。考虑差分变换将个体异质性去除，
$\Delta y_{it} = \rho\Delta y_{i,t-1}+\beta\Delta x_{it} +\Delta \varepsilon_{it}\tag{3}$
称为动态面板的差分方程；由于
$\begin{aligned} Cov(\Delta y_{i,t-1},\Delta \varepsilon_{it}) & = Cov(y_{it}-y_{i,t-1},\varepsilon_{it}-\varepsilon_{i,t-1})\\ & = Cov(y_{it},\varepsilon_{it}) +Cov(y_{it},\varepsilon_{i,t-1})+ Cov(y_{i,t-1},\varepsilon_{i,t-1}) \ne 0 \end{aligned}$
故使用差分方法后，动态面板的差分方程也存在内生性，且 $\Delta y_{i,t-1}$ 为内生解释变量。

2 差分GMM

在差分方程条件下，给定时间长度为 $T$ 的面板数据，由于 $\Delta y_{i,t-1} = y_{i,t-1}-y_{i.t-2}$ 为内生变量，扰动项为 $\Delta \varepsilon_{it} = \varepsilon_{it}-\varepsilon_{i,t-1}$ ,因此工具变量可以取 $y_{i,t-2}$ ,因为它既满足相关性，又满足外生性
$\left\{\begin{array}{l} Cov(y_{i,t-2},y_{i,t-1}-y_{i.t-2}) \ne 0\\ Cov(y_{i,t-2},\varepsilon_{it}-\varepsilon_{i,t-1}) =0 \end{array}\right.$
同理， $y_{i,t-3},y_{i,t-4},\dots y_{i1}$ 都可视为内生变量 $\Delta y_{i,t-1} =y_{i,t-1}-y_{i.t-2}$ 的工具变量。这些变量都称作GMM式工具变量。差分方程的GMM式工具变量个数共有
$\dots +1 = \frac{(t-1)(t-2)}{2}$
当然，这里需要假设解释变量 $x$ 是外生的。因此解释变量自身可以视为工具变量(这种工具变量称为标准型工具变量)，此时工具变量个数为
$\frac{(t-1)(t-2)}{2}+K+1$
其中 $K$ 为解释变量个数。现考虑差分方程的扰动项的方差协方差是否满足球形扰动假设。由于假定 $\varepsilon_{it}$ 为白噪声，故差分方程(3)中新的扰动项
$v_{it} = \Delta \varepsilon_{it} = \varepsilon_{it} -\varepsilon_{i,t-1}$
一定存在一阶序列相关，证明如下
$\begin{aligned} Cov(v_{it},v_{i,t-1}) =& Cov( \varepsilon_{it} -\varepsilon_{i,t-1}, \varepsilon_{i,t-1} -\varepsilon_{i,t-2})\\ =& -Cov(\varepsilon_{i,t-1},\varepsilon_{i,t-1}) = -\sigma^2_\varepsilon \ne 0 \end{aligned}$
但不存在高阶序列相关，证明
$\begin{aligned} Cov(v_{it},v_{i,t-2}) =& Cov( \varepsilon_{it} -\varepsilon_{i,t-1}, \varepsilon_{i,t-2} -\varepsilon_{i,t-3}) =0 \end{aligned}$
差分方程扰动项的方差
$Cov(v_{it},v_{it}) = E(\varepsilon_{it}-\varepsilon_{i,t-1})^2 = 2\sigma^2_\varepsilon$
故新的扰动项的一阶相关系数为
$\rho_{v1} = -\frac{-\sigma^2_\varepsilon}{2\sigma^2_\varepsilon} = -0.5$
二阶及以后的自相关系数为0。差分方程的动态面板的扰动项存在自相关，且存在内生性，这里我们用GMM工具变量解决。但是，工具变量个数远大于内生变量个数，需要用广义矩估计(GMM)方法（2SLS是在球形扰动假设下成立的）。对动态面板的差分方程使用GMM估计称作差分GMM估计法。

3 水平GMM

差分GMM的局限是：

假定自变量为前定解释变量，但差分后 $\Delta x_{it} = x_{i,t}-x_{i,t-1}$ 与差分方差中的扰动项 $\Delta \varepsilon_{it} = \varepsilon_{it}-\varepsilon_{i,t-1}$ 可能存在相关性，进而导致解释变量也存在内生性问题；此时可将原解释变量的滞后项 $\{x_{i,t-1},x_{i,t-2}\dots\}$ 作为 $\Delta x_{it}$ 的工具变量；
对于时间范围较长的数据，使用GMM式工具变量的个数是关于 $t$ 的二次函数，随着时间跨度变长，工具变量增多，容易导致过度识别问题（因此需要限定GMM工具变量的滞后阶数）
差分GMM方法消除了非时变变量（种族、性别、文化等），无法估计非时变变量的系数
动态面板的持续性使 $y_{it}$ 受到过去历史的影响，造成影响的持续性，自回归系数可能趋近1

为解决最后两个问题，Arellano and Bover (1995)在水平方程
$y_{it} = \alpha+\rho y_{i,t-1}+\beta x_{it}+\mu_i+\varepsilon_{it}\tag{1}$
的基础上，将 $\left\{\Delta y_{i, t-1}, \Delta y_{i, t-2}, \cdots\right\}$ 视为内生变量 $y_{i,t-1}$ 的工具变量

相关性条件：

$cov(y_{i,t-1},\Delta y_{i, t-1})=cov(y_{i,t-1}, y_{i, t-1}-y_{i, t-2})\ne 0$

$cov(y_{i,t-1},\Delta y_{i, t-2})=cov(y_{i,t-1}, y_{i, t-2}-y_{i, t-3})\ne 0$

注： $y_{it}$ 具有持续性。

外生性条件：

$cov(\Delta y_{i, t-s},(u_i+\varepsilon_{it}))=cov(\Delta y_{i, t-s},u_i)+cov(\Delta y_{i, t-s}\varepsilon_{it})$

假定等式右边第一部分为0，即个体固定效应与工具变量不相关（现实数据不一定满足）；等式右边第二项
$\mathrm{E}\left(\Delta y_{i, t-s} \varepsilon_{i t}\right)=\mathrm{E}\left(y_{i, t-s} \varepsilon_{i t}\right)-\mathrm{E}\left(y_{i, t-s-1} \varepsilon_{i t}\right)=0-0=0, \quad s \geq 1$
称满足上述条件工具变量满足，使用 $\left\{\Delta y_{i, t-1}, \Delta y_{i, t-2}, \cdots\right\}$ 对水平方差进行GMM估计，称为水平GMM方法

4 系统GMM

系统GMM即将差分GMM与水平GMM结合在一起（Blundell and Bond(1998)），在差分GMM基础上引入新的矩条件
$\mathrm{E}\left[\Delta y_{i, t-1}\left(u_{i}+\varepsilon_{i t}\right)\right]=0$
系统GMM优点与局限

提高估计效率（小样本）
可以估计非时变变量系数
必须满足 $cov(\Delta y_{i, t-s},u_i)=0,s>1$

5 R操作

第一步：使用计量包plm即可，安装与加载plm，并使用pgmm函数

install.packages("plm")
library(plm)
data("EmplUK", package = "plm") # 加载数据

数据不做介绍了。第二步：

## Arellano and Bond (1991), table 4 col. b
z1 <- pgmm(log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 0:1)
           + log(capital) + lag(log(output), 0:1) | lag(log(emp), 2:99),
           data = EmplUK, effect = "twoways", model = "twosteps")
summary(z1, robust = FALSE)

# Twoways effects Two steps model
# 
# Call:
# pgmm(formula = log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 
#      0:1) + log(capital) + lag(log(output), 0:1) | lag(log(emp), 
#         2:99), data = EmplUK, effect = "twoways", model = "twosteps")
# 
# Unbalanced Panel: n = 140, T = 7-9, N = 1031
# 
# Number of Observations Used: 611
# 
# Residuals:
#   Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
# -0.6190677 -0.0255683  0.0000000 -0.0001339  0.0332013  0.6410272 
# 
# Coefficients:
# Estimate Std. Error  z-value  Pr(>|z|)    
# lag(log(emp), 1:2)1     0.474151   0.085303   5.5584 2.722e-08 ***
# lag(log(emp), 1:2)2    -0.052967   0.027284  -1.9413 0.0522200 .  
# lag(log(wage), 0:1)0   -0.513205   0.049345 -10.4003 < 2.2e-16 ***
# lag(log(wage), 0:1)1    0.224640   0.080063   2.8058 0.0050192 ** 
# log(capital)            0.292723   0.039463   7.4177 1.191e-13 ***
# lag(log(output), 0:1)0  0.609775   0.108524   5.6188 1.923e-08 ***
# lag(log(output), 0:1)1 -0.446373   0.124815  -3.5763 0.0003485 ***
#  ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Sargan test: chisq(25) = 30.11247 (p-value = 0.22011)
# Autocorrelation test (1): normal = -2.427829 (p-value = 0.01519)
# Autocorrelation test (2): normal = -0.3325401 (p-value = 0.73948)
# Wald test for coefficients: chisq(7) = 371.9877 (p-value = < 2.22e-16)
# Wald test for time dummies: chisq(6) = 26.9045 (p-value = 0.0001509)