动态面板模型与R

动态面板模型与R

1 动态面板模型

含义:线性面板模型中含有被解释变量滞后项。例如
y i t = α + ρ y i , t − 1 + β x i t + μ i + ε i t y_{it} = \alpha+\rho y_{i,t-1}+\beta x_{it}+\mu_i+\varepsilon_{it} yit=α+ρyi,t1+βxit+μi+εit
其中 i = 1 , 2 , … N i = 1,2,\dots N i=1,2,N, t = 2 , 3 … T t = 2,3\dots T t=2,3T a a a为常数, μ i \mu_i μi为个体异质性, ε \varepsilon ε为扰动项, α \alpha α是常数项, ρ \rho ρ是被解释变量滞后系数; β \beta β为自变量, ε i t \varepsilon_{it} εit为白噪声。称(1)为动态面板数据模型(Dynamic Panel Data,简记DPD)。也称方程(1)为水平方程,即原始方程。显然 C o v ( y i , t − 1 , μ i ) ≠ 0 Cov(y_{i,t-1},\mu_i)\ne0 Cov(yi,t1,μi)=0(无论被解释变量在时间上如何变化, μ i \mu_i μi都是其组成部分)。如果按照静态面板的固定效应模型思路,即组内离差变换得到
y i t − y ˉ i = ρ ( y i , t − 1 − L y ‾ i ) + β ( x i t − x ˉ i ) + ( ε i t − ε ˉ i ) ( t = 2 , ⋯   , T ) y_{i t}-\bar{y}_{i}=\rho\left(y_{i, t-1}-\overline{L y}_{i}\right)+\beta\left(x_{i t}-\bar{x}_{i}\right)+\left(\varepsilon_{i t}-\bar{\varepsilon}_{i}\right) \quad(t=2, \cdots, T) yityˉi=ρ(yi,t1Lyi)+β(xitxˉi)+(εitεˉi)(t=2,,T)
其中 y ˉ i ≡ 1 T − 1 ∑ t = 2 T y i t \bar{y}_{i} \equiv \frac{1}{T-1} \sum_{t=2}^{T} y_{i t} yˉiT11t=2Tyit, L y ‾ i = 1 T − 1 ∑ t = 2 T y i , t − 1 \overline{L y}_{i} = \frac{1}{T-1} \sum_{t=2}^{T} y_{i, t-1} Lyi=T11t=2Tyi,t1, ε ˉ i = 1 T − 1 ∑ t = 2 T ε i t \bar{\varepsilon}_{i} = \frac{1}{T-1} \sum_{t=2}^{T} {\varepsilon}_{i t} εˉi=T11t=2Tεit。因此 C o v ( ( y i , t − 1 − L y ‾ i ) , ( ε i t − ε ˉ i ) ) ≠ 0 Cov(\left(y_{i, t-1}-\overline{L y}_{i}\right),\left(\varepsilon_{i t}-\bar{\varepsilon}_{i}\right) )\ne 0 Cov((yi,t1Lyi),(εitεˉi))=0,故组内离差变换仍然存在固有的内生性,将这种内生性称为动态面板偏差。考虑差分变换将个体异质性去除,
Δ y i t = ρ Δ y i , t − 1 + β Δ x i t + Δ ε i t \Delta y_{it} = \rho\Delta y_{i,t-1}+\beta\Delta x_{it} +\Delta \varepsilon_{it} Δyit=ρΔyi,t1+βΔxit+Δεit
称为动态面板的差分方程;由于
C o v ( Δ y i , t − 1 , Δ ε i t ) = C o v ( y i t − y i , t − 1 , ε i t − ε i , t − 1 ) = C o v ( y i t , ε i t ) + C o v ( y i t , ε i , t − 1 ) + C o v ( y i , t − 1 , ε i , t − 1 ) ≠ 0 \begin{aligned} Cov(\Delta y_{i,t-1},\Delta \varepsilon_{it}) & = Cov(y_{it}-y_{i,t-1},\varepsilon_{it}-\varepsilon_{i,t-1})\\ & = Cov(y_{it},\varepsilon_{it}) +Cov(y_{it},\varepsilon_{i,t-1})+ Cov(y_{i,t-1},\varepsilon_{i,t-1}) \ne 0 \end{aligned} Cov(Δyi,t1,Δεit)=Cov(yityi,t1,εitεi,t1)=Cov(yit,εit)+Cov(yit,εi,t1)+Cov(yi,t1,εi,t1)=0
故使用差分方法后,动态面板的差分方程也存在内生性,且 Δ y i , t − 1 \Delta y_{i,t-1} Δyi,t1为内生解释变量。


2 差分GMM

在差分方程条件下,给定时间长度为 T T T的面板数据,由于 Δ y i , t − 1 = y i , t − 1 − y i . t − 2 \Delta y_{i,t-1} = y_{i,t-1}-y_{i.t-2} Δyi,t1=yi,t1yi.t2为内生变量,扰动项为 Δ ε i t = ε i t − ε i , t − 1 \Delta \varepsilon_{it} = \varepsilon_{it}-\varepsilon_{i,t-1} Δεit=εitεi,t1,因此工具变量可以取 y i , t − 2 y_{i,t-2} yi,t2,因为它既满足相关性,又满足外生性
{ C o v ( y i , t − 2 , y i , t − 1 − y i . t − 2 ) ≠ 0 C o v ( y i , t − 2 , ε i t − ε i , t − 1 ) = 0 \left\{\begin{array}{l} Cov(y_{i,t-2},y_{i,t-1}-y_{i.t-2}) \ne 0\\ Cov(y_{i,t-2},\varepsilon_{it}-\varepsilon_{i,t-1}) =0 \end{array}\right. {Cov(yi,t2,yi,t1yi.t2)=0Cov(yi,t2,εitεi,t1)=0
同理, y i , t − 3 , y i , t − 4 , … y i 1 y_{i,t-3},y_{i,t-4},\dots y_{i1} yi,t3,yi,t4,yi1都可视为内生变量 Δ y i , t − 1 = y i , t − 1 − y i . t − 2 \Delta y_{i,t-1} =y_{i,t-1}-y_{i.t-2} Δyi,t1=yi,t1yi.t2的工具变量。这些变量都称作GMM式工具变量。差分方程的GMM式工具变量个数共有
t − 2 + t − 3 + ⋯ + 1 = ( t − 1 ) ( t − 2 ) 2 t-2 +t-3+ \dots +1 = \frac{(t-1)(t-2)}{2} t2+t3++1=2(t1)(t2)
当然,这里需要假设解释变量 x x x是外生的。因此解释变量自身可以视为工具变量(这种工具变量称为标准型工具变量),此时工具变量个数为
( t − 1 ) ( t − 2 ) 2 + K + 1 \frac{(t-1)(t-2)}{2}+K+1 2(t1)(t2)+K+1
其中 K K K为解释变量个数。现考虑差分方程的扰动项的方差协方差是否满足球形扰动假设。由于假定 ε i t \varepsilon_{it} εit为白噪声,故差分方程(3)中新的扰动项
v i t = Δ ε i t = ε i t − ε i , t − 1 v_{it} = \Delta \varepsilon_{it} = \varepsilon_{it} -\varepsilon_{i,t-1} vit=Δεit=εitεi,t1
一定存在一阶序列相关,证明如下
C o v ( v i t , v i , t − 1 ) = C o v ( ε i t − ε i , t − 1 , ε i , t − 1 − ε i , t − 2 ) = − C o v ( ε i , t − 1 , ε i , t − 1 ) = − σ ε 2 ≠ 0 \begin{aligned} Cov(v_{it},v_{i,t-1}) =& Cov( \varepsilon_{it} -\varepsilon_{i,t-1}, \varepsilon_{i,t-1} -\varepsilon_{i,t-2})\\ =& -Cov(\varepsilon_{i,t-1},\varepsilon_{i,t-1}) = -\sigma^2_\varepsilon \ne 0 \end{aligned} Cov(vit,vi,t1)==Cov(εitεi,t1,εi,t1εi,t2)Cov(εi,t1,εi,t1)=σε2=0
但不存在高阶序列相关,证明
C o v ( v i t , v i , t − 2 ) = C o v ( ε i t − ε i , t − 1 , ε i , t − 2 − ε i , t − 3 ) = 0 \begin{aligned} Cov(v_{it},v_{i,t-2}) =& Cov( \varepsilon_{it} -\varepsilon_{i,t-1}, \varepsilon_{i,t-2} -\varepsilon_{i,t-3}) =0 \end{aligned} Cov(vit,vi,t2)=Cov(εitεi,t1,εi,t2εi,t3)=0
差分方程扰动项的方差
C o v ( v i t , v i t ) = E ( ε i t − ε i , t − 1 ) 2 = 2 σ ε 2 Cov(v_{it},v_{it}) = E(\varepsilon_{it}-\varepsilon_{i,t-1})^2 = 2\sigma^2_\varepsilon Cov(vit,vit)=E(εitεi,t1)2=2σε2
故新的扰动项的一阶相关系数为
ρ v 1 = − − σ ε 2 2 σ ε 2 = − 0.5 \rho_{v1} = -\frac{-\sigma^2_\varepsilon}{2\sigma^2_\varepsilon} = -0.5 ρv1=2σε2σε2=0.5
二阶及以后的自相关系数为0。差分方程的动态面板的扰动项存在自相关,且存在内生性,这里我们用GMM工具变量解决。但是,工具变量个数远大于内生变量个数,需要用广义矩估计(GMM)方法(2SLS是在球形扰动假设下成立的)。对动态面板的差分方程使用GMM估计称作差分GMM估计法。


3 水平GMM

差分GMM的局限是:

  • 假定自变量为前定解释变量,但差分后 Δ x i t = x i , t − x i , t − 1 \Delta x_{it} = x_{i,t}-x_{i,t-1} Δxit=xi,txi,t1与差分方差中的扰动项 Δ ε i t = ε i t − ε i , t − 1 \Delta \varepsilon_{it} = \varepsilon_{it}-\varepsilon_{i,t-1} Δεit=εitεi,t1可能存在相关性,进而导致解释变量也存在内生性问题;此时可将原解释变量的滞后项 { x i , t − 1 , x i , t − 2 …   } \{x_{i,t-1},x_{i,t-2}\dots\} {xi,t1,xi,t2}作为 Δ x i t \Delta x_{it} Δxit的工具变量;

  • 对于时间范围较长的数据,使用GMM式工具变量的个数是关于 t t t的二次函数,随着时间跨度变长,工具变量增多,容易导致过度识别问题(因此需要限定GMM工具变量的滞后阶数)

  • 差分GMM方法消除了非时变变量(种族、性别、文化等),无法估计非时变变量的系数

  • 动态面板的持续性使 y i t y_{it} yit受到过去历史的影响,造成影响的持续性,自回归系数可能趋近1

为解决最后两个问题,Arellano and Bover (1995)在水平方程
y i t = α + ρ y i , t − 1 + β x i t + μ i + ε i t y_{it} = \alpha+\rho y_{i,t-1}+\beta x_{it}+\mu_i+\varepsilon_{it} yit=α+ρyi,t1+βxit+μi+εit
的基础上,将 { Δ y i , t − 1 , Δ y i , t − 2 , ⋯   } \left\{\Delta y_{i, t-1}, \Delta y_{i, t-2}, \cdots\right\} {Δyi,t1,Δyi,t2,}视为内生变量 y i , t − 1 y_{i,t-1} yi,t1的工具变量

  • 相关性条件:

c o v ( y i , t − 1 , Δ y i , t − 1 ) = c o v ( y i , t − 1 , y i , t − 1 − y i , t − 2 ) ≠ 0 cov(y_{i,t-1},\Delta y_{i, t-1})=cov(y_{i,t-1}, y_{i, t-1}-y_{i, t-2})\ne 0 cov(yi,t1,Δyi,t1)=cov(yi,t1,yi,t1yi,t2)=0

c o v ( y i , t − 1 , Δ y i , t − 2 ) = c o v ( y i , t − 1 , y i , t − 2 − y i , t − 3 ) ≠ 0 cov(y_{i,t-1},\Delta y_{i, t-2})=cov(y_{i,t-1}, y_{i, t-2}-y_{i, t-3})\ne 0 cov(yi,t1,Δyi,t2)=cov(yi,t1,yi,t2yi,t3)=0

注: y i t y_{it} yit具有持续性。

  • 外生性条件:

c o v ( Δ y i , t − s , ( u i + ε i t ) ) = c o v ( Δ y i , t − s , u i ) + c o v ( Δ y i , t − s ε i t ) cov(\Delta y_{i, t-s},(u_i+\varepsilon_{it}))=cov(\Delta y_{i, t-s},u_i)+cov(\Delta y_{i, t-s}\varepsilon_{it}) cov(Δyi,ts,(ui+εit))=cov(Δyi,ts,ui)+cov(Δyi,tsεit)

假定等式右边第一部分为0,即个体固定效应与工具变量不相关(现实数据不一定满足);等式右边第二项
E ( Δ y i , t − s ε i t ) = E ( y i , t − s ε i t ) − E ( y i , t − s − 1 ε i t ) = 0 − 0 = 0 , s ≥ 1 \mathrm{E}\left(\Delta y_{i, t-s} \varepsilon_{i t}\right)=\mathrm{E}\left(y_{i, t-s} \varepsilon_{i t}\right)-\mathrm{E}\left(y_{i, t-s-1} \varepsilon_{i t}\right)=0-0=0, \quad s \geq 1 E(Δyi,tsεit)=E(yi,tsεit)E(yi,ts1εit)=00=0,s1
称满足上述条件工具变量满足,使用 { Δ y i , t − 1 , Δ y i , t − 2 , ⋯   } \left\{\Delta y_{i, t-1}, \Delta y_{i, t-2}, \cdots\right\} {Δyi,t1,Δyi,t2,}对水平方差进行GMM估计,称为水平GMM方法


4 系统GMM

系统GMM即将差分GMM与水平GMM结合在一起(Blundell and Bond(1998)),在差分GMM基础上引入新的矩条件
E [ Δ y i , t − 1 ( u i + ε i t ) ] = 0 \mathrm{E}\left[\Delta y_{i, t-1}\left(u_{i}+\varepsilon_{i t}\right)\right]=0 E[Δyi,t1(ui+εit)]=0
系统GMM优点与局限

  • 提高估计效率(小样本)
  • 可以估计非时变变量系数
  • 必须满足 c o v ( Δ y i , t − s , u i ) = 0 , s > 1 cov(\Delta y_{i, t-s},u_i)=0,s>1 cov(Δyi,ts,ui)=0,s>1

5 R代码

第一步:使用计量包plm即可,安装与加载plm,并使用pgmm函数

install.packages("plm")
library(plm)
data("EmplUK", package = "plm") # 加载数据

数据不做介绍了。第二步:

## Arellano and Bond (1991), table 4 col. b
z1 <- pgmm(log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 0:1)
           + log(capital) + lag(log(output), 0:1) | lag(log(emp), 2:99),
           data = EmplUK, effect = "twoways", model = "twosteps")
summary(z1, robust = FALSE)

# Twoways effects Two steps model
# 
# Call:
# pgmm(formula = log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 
#      0:1) + log(capital) + lag(log(output), 0:1) | lag(log(emp), 
#         2:99), data = EmplUK, effect = "twoways", model = "twosteps")
# 
# Unbalanced Panel: n = 140, T = 7-9, N = 1031
# 
# Number of Observations Used: 611
# 
# Residuals:
#   Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
# -0.6190677 -0.0255683  0.0000000 -0.0001339  0.0332013  0.6410272 
# 
# Coefficients:
# Estimate Std. Error  z-value  Pr(>|z|)    
# lag(log(emp), 1:2)1     0.474151   0.085303   5.5584 2.722e-08 ***
# lag(log(emp), 1:2)2    -0.052967   0.027284  -1.9413 0.0522200 .  
# lag(log(wage), 0:1)0   -0.513205   0.049345 -10.4003 < 2.2e-16 ***
# lag(log(wage), 0:1)1    0.224640   0.080063   2.8058 0.0050192 ** 
# log(capital)            0.292723   0.039463   7.4177 1.191e-13 ***
# lag(log(output), 0:1)0  0.609775   0.108524   5.6188 1.923e-08 ***
# lag(log(output), 0:1)1 -0.446373   0.124815  -3.5763 0.0003485 ***
#  ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Sargan test: chisq(25) = 30.11247 (p-value = 0.22011)
# Autocorrelation test (1): normal = -2.427829 (p-value = 0.01519)
# Autocorrelation test (2): normal = -0.3325401 (p-value = 0.73948)
# Wald test for coefficients: chisq(7) = 371.9877 (p-value = < 2.22e-16)
# Wald test for time dummies: chisq(6) = 26.9045 (p-value = 0.0001509)

动态面板主要关注过度识别检验Sargan与自相关AR(1)和AR(2)。怎么检验就不说了,具体方法help(pgmm),太困了不写了。


-END-

参考文献

陈强.高级计量经济学[M].高等教育出版社

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值