我将使用mode='same'而不是mode='full',因为使用mode='full'我们可以得到极端位移的协方差,其中只有1个数组元素与self重叠,其余元素为零。那些不会有意思的。当mode='same'时,移位数组至少有一半与原始数组重叠。在
另外,要获得真正的相关系数(r),需要除以重叠的大小,而不是原始x的大小(在我的代码中,这些是np.arange(n-1, n//2, -1))。然后每个输出将在-1和1之间。在
瞥一眼Durbin–Watson statistic,它与2(1-r)相似,表明人们认为它低于1的值是自相关的一个重要标志,它对应于r>;0.5。这就是我下面使用的。对于自相关显著性的统计学合理处理,请参阅统计学文献;一个起点是为您的时间序列建立一个模型。在def autocorr(x):
n = x.size
norm = (x - np.mean(x))
result = np.correlate(norm, norm, mode='same')
acorr = result[n//2 + 1:] / (x.var() * np.arange(n-1, n//2, -1))
lag = np.abs(acorr).argmax() + 1
r = acorr[lag-1]
if np.abs(r) > 0.5:
print('Appears to be autocorrelated with r = {}, lag = {}'. format(r, lag))
else:
print('Appears to be not autocorrelated')
return r, lag
两个玩具示例的输出:Appears to be not autocorrelated
Appears to be autocorrelated with r = 1.0, lag = 4