原文链接:https://www.lianxh.cn/news/5bbe8408904fb.html
目录
1. 时间趋势项与时间虚拟变量
1.1 时间趋势项
许多经济、金融时间序列会随时间有一个增长的趋势,我们称其具有时间趋势 (time trend)。假如在因果推断中我们忽视了两组序列具有相同或者相反的趋势,则很有可能错误地认为其中一个变量的变化是由另一个变量的变化所导致的,导致伪回归问题 (spurious regression problem)。
在回归方程中加入时间趋势项可以避免此问题,常见的时间趋势有线性趋势 (linear time trend)、指数趋势 (exponential trend) 与二次型趋势 (quadratic time trend)。
1.1.1 线性趋势
考虑以 作为被解释变量,有两个可观测解释变量 (, ) 的线性回归方程:
系数 的含义是:其他变量不变的条件下,随时间流逝 从某一期到下一期所发生的变化,这种变化的大小固定为 ,并且与 , 是无关的。假如回归中遗漏了变量 ,那么我们将会得到有偏的 , 的估计值。值得注意的是,当 和 也存在时间趋势时,变量 的遗漏仍然会造成系数估计的偏误。
1.1.2 指数趋势
指数趋势是指时间序列每一期的增长率是相同的,具体回归模型可表示如下:
此时再来考察系数 的含义,仍然假设其他变量不发生变化,即当 以及 时:
由以上推导可以看出, 代表的是 每期的增长率,并且其不随时间变化。
1.1.3 二次型趋势
另一种比较常用的时间趋势项形式为二次型,与上两种形式不同的是,二次型时间趋势会随时间发生变化,考虑以下回归模型:
此时,假设其他变量不变,我们对 关于 求导数,得到时间对 的边际效应为 ,显然因变量 的时间趋势会随时间改变,此时我们可以借助于 margins
与 marginsplot
命令更直观地进行边际分析。详情请见 Stata因子变量:好用好用! (微信版)。
这里需要注意的是,不是加入越多高次的时间趋势项就越好,因为当我们加入足够多的 的多项式时,任何一组时间序列都能很好地被刻画,但对于我们寻找哪些自变量会影响 没有什么帮助 (Wooldridge, 2016)。