写在前面:由于与协整有关的概念很多,本文与其他同系列文章比起来偏长,建议预留充足时间,拿好笔记本或者收藏起来慢慢看。
虽然近年来协整(cointegration)这个方法基本已经荣升为时间序列的标准做法,是个经济学学生都会用到,但在其刚出道的时候,地位基本上等同于时间序列的救世主,携带着那来自Engle和Granger的福音。
简单来讲,在时间序列分析刚开始的时候,大家是不屑于考虑什么平稳性问题的,反正随便抓两个东西就可以跑一遍回归。但对于两个不平稳的(此处特指I(1)序列)时间序列
想想半夜两个喝醉酒的酒鬼在大街上随机游走,他们往哪里走都是一件完全随机的事情。他们虽然没有手拉手,但是有很大的概率我们会观察到他们走的路径是相似的!不信?那就举个例子咯。
![6e4126ac09e9c39de8649a1463635fcd.png](https://img-blog.csdnimg.cn/img_convert/6e4126ac09e9c39de8649a1463635fcd.png)
上图描绘的是美国在科学研究上的支出和美国以窒息方式自杀的人数,相关系数99.79%。看起来美帝的科学研究确实能把人逼死……
![35949435524bbb8cc2b6f14ae2901b77.png](https://img-blog.csdnimg.cn/img_convert/35949435524bbb8cc2b6f14ae2901b77.png)
上图描绘的是美国人均芝士消费和被床单绕死的人数(谁没事干统计这个……),相关系数94.71%。听到了吧,你麻麻都跟你说了不要吃芝士不要吃芝士,会胖的……
![df8d779e771dbff5f8e8ef9512c135fd.png](https://img-blog.csdnimg.cn/img_convert/df8d779e771dbff5f8e8ef9512c135fd.png)
上图是每年选出的美国小姐的年龄和以高温方式被谋杀的人数,相关系数87.01%。可能美国小姐年龄越小,对社会的教化作用越好吧……
以上图源均为Tyler Vigen的网页,大家可以在上面找到更多好玩的伪回归数据。
注意,以上的所有数据都是不平稳的序列,所以才会有无厘头的相关性出现。如果我们的文章里搞出了这些伪回归的东西,那就自(gui)求(qiu)多(dao)福(shi)吧……
自从人类发现了伪回归这个问题之后,时间序列分析顿时变得暗淡无关,毕竟以后做分析只能用平稳序列了,但你看看宏观数据,有哪个平稳了嘛。这样就只能做差分,差分又损失掉了长期信息(不懂戳这里),那我们干脆弃坑得了。好在我们有了协整,可以让我们不用差分又不至于产生伪回归,你看看这是不是隔离几个月之后喝到一杯Costa冰拿铁的感觉。(虽然还喝不到……)
双变量协整
那我们正式讨论什么是协整。如上,假定我们有两个I(1)的不平稳序列