一、理论模型
本文选择向量自回归模型,简称VAR模型,是一种常用的计量经济模型,加粗样式1980年由克里斯托弗·西姆斯(Christopher Sims)提出。VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。VAR模型用来估计联合内生变量的动态关系,而不带有任何事先约束条件。它是AR模型的推广,此模型目前已得到广泛应用。
向量自回归(VAR)是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,并且在一定的条件下,多元MA和ARMA模型也可转化成VAR模型,因此近年来VAR模型受到越来越多的经济工作者的重视。
VAR模型描述在同一样本期间内的n个变量(内生变量)可以作为它们过去值的线性函数。
一个
V
A
R
(
p
)
VAR(p)
VAR(p)模型可以写成为:
Y
t
=
c
+
A
1
Y
t
−
1
+
.
.
.
+
A
p
Y
t
−
p
+
e
t
Y_{t} =c+A_{1}Y_{t-1} +...+A_{p}Y_{t-p}+e_{t}
Yt=c+A1Yt−1+...+ApYt−p+et
其中:c是n×1常数向量,Ai是n×n矩阵。et是n×1误差向量,满足:误差项的均值为0;误差项的协方差矩阵为Ω(一个n×n正定矩阵);对于所有不为0的k都满足误差项不存在自相关.
二 、研究方法
(1)数据处理
由于数据的自然对数变换不改变原有的协整关系,并能使其趋势线性化,消除时间序列中存在的异方差现象,所以对所有数据取其自然对数值,以增强数据线性化趋势消除异方差,同时便于考察各变量对我国出国留学人数的敏感性。
(2)单位根检验
在对时间序列数据进行回归分析之前,为了避免伪回归,要先进行时间序列数据的平稳性检验,即单位根检验。如果时间序列数据满足:均值是与时间t无关的常数;方差是与时间t无关的常数;协方差是只与间隔K有关,与时间t无关的常数;则称此时间序列是平稳的。简言之,就是时间序列数据围着某一特定均值上下波动。
(3)协整分析
协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。协整检验主要有EG两步法和JJ检验。EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性,而JJ检验是基于回归系数的检验,前提是建立VAR模型(即模型符合ADL模式)。然而EG两步法在样本容量有限的条件下,对参数的估计存在偏差,且随着样本的增大,其估计偏差也在增大。
(4)Granger因果检验
格兰杰因果关系检验是一种假设检定的统计方法,检验一组时间序列x是否为另一组时间序列y的原因。它的基础是回归分析当中的自回归模型。回归分析通常只能得出不同 变量间的同期相关性;自回归模型只能得出同一变量前后期的相关性.
三、数据与描述统计
1、数据来源
本文选择我国出国留学人数、我国失业率、我国居民消费水平、我国研究生在学人数。选取1988-2018年的数据,共31组数据,具体变量说明如下:
变量 | 变量说明 | 取值 | 解释说明 |
---|---|---|---|
NAB | 我国出国留学人数 | ≥0 | 单位万人,数据来自《中国统计年鉴》 |
CON | 我国居民消费水平 | ≥0 | 单位元, 数据来自《中国统计年鉴》 |
NPO | 我国研究生在学人数 | ≥0 | 单位万人,数据来自《中国统计年鉴》 |
2、描述数据
Mean | Median | Maximum | Minimum | Std. Dev. | |
---|---|---|---|---|---|
NAB | 18.31 | 11.73 | 66.21 | 0.29 | 20.58 |
CON | 7839.39 | 4606.00 | 25002.00 | 684.00 | 7318.64 |
NPO | 31.59 | 26.89 | 85.80 | 2.86 | 26.45 |
由上表可知,NAB的均值为18.31,最小值为0.29,最大值为66.21,标准差为20.58,说明NAB数据离散程度较大,数据波动较大,且总体出口留学人数一般。
CON的均值为7839.39,最小值为684.00,最大值为25002.00,标准差为7318.64,说明CON数据离散程度较大,数据波动较大,且总体居民消费水平一般。
NPO的均值为31.59,最小值为2.86,最大值为85.80,标准差为26.45,说明NPO数据离散程度较大,数据波动较大,且总体研究生在学人数一般。
四、实证分析
1、ADF单位根检验
本次选择迪克一富勒检验法, 即ADF检验,分别对LnNAB、LnCON、LnNPO的原序列、一阶差分进行无截距项和时间趋势ADF检验,结果如下。
变量名 | 差分阶数 | ADF值 | 1%临界 | 5%临界 | 10%临界 | 平稳性 |
---|---|---|---|---|---|---|
LnNAB | 原 | 0.37414 | -4.39431 | -3.6122 | -3.24308 | 非 |
一 | -6.71578 | -4.39431 | -3.6122 | -3.24308 | 1% | |
LnCON | 原 | -3.16829 | -4.30982 | -3.57424 | -3.22173 | 非 |
一 | -3.95710 | -4.32398 | -3.58062 | -3.22533 | 5% | |
LnNPO | 原 | -0.31093 | -4.30982 | -3.57424 | -3.22173 | 非 |
一 | -15.6969 | -4.30982 | -3.57424 | -3.22173 | 1% |
根据ADF值和临界值来判断时间序列的平稳性,若ADF小于某个临界值,则拒绝原假设,可以认为时间序列在某个临界值上是平稳的;若ADF大于所有临界值,则接受原假设,可以认为时间序列是非平稳的。
由上表可知,LnNAB、LnCON、LnNPO的原序列的ADF值均大于所有的临界值,即以上经济变量的原序列都是非平稳的。于是对上述变量进行一阶差分,结果显示LnNAB、LnNPO为1%平稳,LnCON为5%平稳。
综上所述,LnNAB、LnCON、LnNPO为一阶单整。因变量LnNAB的单整阶数最低,因此可以进行协整分析。
2、协整分析
由方法介绍可知,我们选择JJ检验,从而降低估计偏差。具体结果所示。
Hypothesized | Eigenvalue | Trace Statistic | 0.05 CriticalValue | Prob. |
---|---|---|---|---|
None * | 0.642242 | 42.54298 | 29.79707 | 0.0010 |
At most 1 | 0.264461 | 12.73395 | 15.49471 | 0.1249 |
At most 2 | 0.123615 | 3.82654 | 3.841466 | 0.0504 |
由上表可知,当假设三个变量之间无协整关系时,其P=0.0010<0.05,说明结果显著,即拒绝原假设,可以认为三个变量之间存在协整关系; 当假设至多两个变量之间有协整关系时,其P=0.0504<0.1,说明结果显著,即拒绝原假设,可以认为在90%的置信区间下,三个变量之间至少两个个存在协整关系。
3、确定模型滞后阶数
由协整分析可知,出国留学人数、居民消费水平和研究生在学人数存在协整关系,且至多两个协整,且为同阶单整,可以做VAR模型,且通过初次VAR模型确定模型滞后阶数。
Lag | LogL | LR | FPE | AIC | SC | HQ |
---|---|---|---|---|---|---|
0 | -37.3676 | NA | 0.003992 | 2.990191 | 3.134173 | 3.033005 |
1 | 86.59175 | 211.19 | 8.05E-07 | -5.52531 | -4.94939 | -5.35406 |
2 | 110.8634 | 35.958 | 2.68E-07 | -6.65655 | -5.64868 | -6.35685 |
3 | 127.7608 | 21.27818* | 1.61E-07 | -7.24154 | -5.801720* | -6.81341 |
4 | 140.1621 | 12.86063 | 1.45e-07* | -7.493488* | -5.62172 | -6.936915* |
某行星号最多,就选择某行的滞后阶数。由上表可知,当滞后阶数为4阶时,其FRE、AIC、HQ值均为最小,于是选择最优滞后阶数为4阶。
4、变量外生性检验
本文利用Granger因果检验来检验变量的外生性。Granger因果检验是建立VAR模型的前提检验,如果变量X不是变量Y的Granger因果原因,那么就不能做VAR模型。具体结果如下。
Excluded | Chi-sq | df | Prob |
---|---|---|---|
LNCON | 14.46924 | 4 | 0.0059 |
LNNPO | 18.96715 | 4 | 0.0008 |
All | 14.46924 | 4 | 0.0059 |
原假设为居民消费指数和研究生在学人数不是影响出国留学人数的格兰杰因果原因。由上表可知,其检验P值分别为0.0059、0.0008,均小于0.01,说明结果显著,即拒绝原假设,可以认为在99%的置信区间下,居民消费指数和研究生在学人数是影响出国留学人数的格兰杰因果原因。即居民消费指数和研究生在学人数对出国留学人数有预测能力。也就是说,居民消费指数和研究生在学人数是出国留学人数的内生性变量。所建立的VAR模型是有意义的。
5、建立VAR模型
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210509133505705.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzMjg2ODk4,size_16,color_FFFFFF,t_70#pic_center
在上表中, 上行表示变量系数,下行表示变量系数的T检验值。由上表可知,模型调整后的R方为0.993833,说明对出国留学人数的解释率为99.3833%,模型拟合效果很好。F=350.1718,大于F临界值,说明模型方程显著。且各系数T检验值均大于各临界值,故模型方程显著,即方程为:
LNNAB = 0.371181LNNAB(-1) +0.008448LNNAB(-2) -0.41694LNNAB(-3) -0.11502LNNAB(-4) + 0.758688LNCON(-1) + 0.115902LNCON(-2) -1.00418LNCON(-3) +1.060701LNCON(-4) + 1.049009LNNPO(-1) -0.26145LNNPO(-2) -0.16366LNNPO(-3) + 0.129931LNNPO(-4) -7.73947
6、判断模型稳定性
如果VAR模型所有根模的倒数都小于1,即都在单位圆内,则该模型是稳定的;如果VAR模型所有根模的倒数都大于1即都在单位圆外,则该模型是不稳定的。如果被估计的VAR模型不稳定・则得到的结果有些是无效的。(如脉冲响应函数的标准误差)
由上图可知,各变量的AR根的根模的倒数都小于1,即都在单位圆内。所以,我们建立的VAR模型是稳定的,可以进行脉冲响应分析和方差分析
7、脉冲响应分析
由之前分析可知,此VAR模型是稳定的,于是选择脉冲响应分析。且考虑出国留学人数对自身的脉冲响应和居民消费指数、研究生在学人数对出国留学人数的影响。具体如下图所示。
由上图可知,出国留学人数自身在第6期下降至最低,再有一个小的冲击,使得出国留学人数在第6期开始缓慢增长,至第9期到达最高,再有所下降。其原因可能是,随着出国热的兴起,其出国人数在第1期达到饱和,然后开始下滑,下滑至最低点,又开始上升,但始终处于非饱和状态。
上图为居民消费水平对出国留学人数的脉冲响应图。由上图可知,第1期居民消费水平对出国留学人数没有影响,在第2期有个小小的冲击,使得出国留学水平有所增长,然后开始有所下降,降至低6期最低,接着开始缓慢上升。
上图为研究生在学人数对出国留学人数的脉冲响应图。由上图可知,第1期研究生在学人数对出国留学人数没有影响,在第2期有个小小的冲击,使得出国留学人数有所增长,然后开始有所下降,且一直呈现缓慢下降趋势。
7、方差分解
方差分解是通过分析每一个结构冲击对内生变量变化(通常用方差来衡量)的贡献度,进一步评价不同结构冲击的重要性。因此,方差分解给出对VAR模型中的变量产生影响的每个随机扰动的相对重要性的信息。具体结果如下表所示。
Period | S.E. | LNNAB | LNCON | LNNPO |
---|---|---|---|---|
1 | 0.110012 | 100.0000 | 0.000000 | 0.000000 |
2 | 0.129826 | 82.39752 | 0.568039 | 17.03444 |
3 | 0.140567 | 70.30479 | 1.500835 | 28.19438 |
4 | 0.150305 | 67.42144 | 2.711806 | 29.86675 |
5 | 0.166193 | 61.63444 | 11.13326 | 27.23230 |
6 | 0.178425 | 59.02392 | 16.30791 | 24.66817 |
7 | 0.179908 | 59.26488 | 16.17539 | 24.55973 |
8 | 0.183096 | 57.32232 | 18.72532 | 23.95236 |
9 | 0.192636 | 52.71040 | 25.43060 | 21.85901 |
10 | 0.202548 | 48.12188 | 31.77471 | 20.10341 |
由上表可知,在第1期,出国留学人数的信息解释均由自身解释。且从第2期开始,出国留学人数的信息解释率开始下降,居民消费水平和研究生在学人数的信息解释率开始上升,其具体变化如下图可知。
由上图可知,出国留学人数自身的信息解释率一直呈现出不断下降的趋势。居民消费水平对出国留学人数的信息解释率呈现不断上升的趋势。而研究生在学人数对出国留学人数的信息解释率在短期内增长较快,随后开始持平,后期开始有所下降。说明随着时间的增长,出国留学人数滋生的影响开始有所下降,研究在学人数短期影响较大,长期较均衡,居民消费水平对出国留学的影响则是不断增大。
8、模型预测
将时间序列扩大值2025年,用已建立的VAR模型进行拟合与预测。具体结果如下图表所示。
时间 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 | 2025 |
---|---|---|---|---|---|---|---|
出国留学人数 | 92.6369 | 100.2244 | 108.6935 | 120.0713 | 135.1615 | 153.0895 | 171.6604 |
由上表可以,根据建立的VAR模型预测未来7年的出国留学人数呈现增长的趋势,且增长幅度在逐步增大。
由上图可知,本文所建立的VAR模型对已有数据的拟合程度较高,大部分均重合,且波动在正常范围内。未来7年的预测数据显示,数据略成指数增长趋势,即增长速度逐步增加,波动范围逐渐削减。
以上是全部过程。完整的论文以及《结婚率的影响因素分析》完整可在资源处下载。