本文介绍时间序列自相关性,并通过示例介绍R计算过程。
时间序列自相关性
自相关性是时间序列与其自身滞后一定连续时间周期的相关性程度。它也被称为“序列相关”或“滞后相关”,即衡量变量的当前值和历史值之间的关系。
当自相关性较高时,可以简单依赖过去值预测未来值。
R计算自相关性示例
假设我们有下面时间序列数据,表示在15个不同时间周期内数值变化情况:
#define data
x <- c(22, 24, 25, 25, 28, 29, 34, 37, 40, 44, 51, 48, 47, 50, 51)
我们可以使用acf()函数计算每个滞后时间周期的自相关性:
acf(x, pl=FALSE)
# Autocorrelations of series ‘x’, by lag
#
# 0 1 2 3 4 5 6 7 8 9 10 11
# 1.000 0.832 0.656 0.491 0.279 0.031 -0.165 -0.304 -0.401 -0.458 -0.450 -0.369
下面对输出结果解释如下:
- 滞后0周期自相关性为1
- 滞后1周期自相关性为0.832
- 滞后2周期自相关性为0.656
- 滞后3周期自相关性为0.491
…
我们也可以使用lag参数设定滞后周期:
#calculate autocorrelations up to lag=5
acf(x, lag=5, pl=FALSE)
# Autocorrelations of series 'x', by lag
#
# 0 1 2 3 4 5
# 1.000 0.832 0.656 0.491 0.279 0.031
** 自相关性图示展示
acf默认情况下即显示自相关性的图示,因此只需去掉pl=FALSE
参数:
#plot autocorrelation function
acf(x)
x轴显示滞后周期,y轴显示与滞后周期间的自相关性。缺省图从滞后周期为0开始,所以自相关性总是为1。我们还可以指定图示的标题:
#plot autocorrelation function with custom title
acf(x, main='Autocorrelation by Lag')