时间序列
一、时间序列是什么?
时间序列是指某种现象某一指标在不同时间上的各个数值,按照时间先后顺序排列而形成的序列。基于随机过程理论,用于动态数据处理。经典的统计分析都嘉定数据序列具有独立性,而时间序列分析则侧重研究数据序列的相互依赖关系。
二、时间序列分类
1.白噪声序列
纯随机序列,没有预测价值。
2.平稳非白噪声序列
均值/方差都是常数:AR MA ARMA
3.非平稳序列
差分变换,转化为平稳序列进行拟合 —>ARIMA
三. 时间序列主要模型
1. ARIMA
平稳性:要求样本时间序列所得的拟合曲线能够按照现有的形态“惯性”延续下去。
要求序列的均值和方差不发生明显变化。
严平稳:数据的分布不随时间的改变而改变。Eg: 白噪声(正态),期望为0,方差为1.
弱平稳:期望与相关系数不变。(大多数分析数据都为弱平稳)
差分法:时间序列在t时刻和t-1时刻的差值
data['diff1'] = data['igmb'].diff(1) --