时间序列
简而言之,时间序列就是带时间戳的数值序列。股票,期货等金融数据就是典型的时间序列。量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子。
平稳性定义
所谓时间序列的平稳性,是指时间序列的均值,方差以及协方差都是常数,与时间t无关。这样的序列才可以作为我们基于历史预测未来的基础。
满足以上条件属于严平稳,一般达到弱平稳都是可以接受的。
平稳性是当前时间序列分析的前提条件,因为我们的建模过程基本都是以大数定理和中心极限定理为理论基础(比如ARMA,ARIMA模型等),而大数定理和中心极限定理也是有前提条件的,那就是要求样本同分布(等价于时间序列的平稳性)。如果这个条件不满足,那么我们的很多分析结果是不可靠的。
白噪声属于平稳序列,因为它的均值为0,方差为常数,协方差为0。但白噪声属于纯随机序列,基于它预测是没有意义的。
随机游走属于非平稳序列,因为它的均值为常数,但是方差为非常数,与时间t有关。
平稳性检验
对于一个时间序列,我们如何处理呢?
1 检验序列是否平稳性序列
2 如果序列非平稳,通过数学变换为平稳性序列
3 检验序列是否白噪声
4 下一步
平稳性检验常用方法有ADF检验和KPSS检验。
平稳性检验-ADF Test
ADF Test:Augmented Dickey-Fuller Test
首先假设时间序列是不稳定的,根据假设求得的置信度P值如果小于阈值(一般为1%),那么我们认为假设不成立,时间序列是稳定的ÿ