ARIMA
传送门:https://www.bilibili.com/video/BV1dT4y1V7qW?p=3&share_source=copy_web
验证平稳性
要求我们用其时间特性的时候,就得需要该样本数据的均值和方差
不发生明显的变化,就是按照现有的形状拟合延续
严平稳
:数据的分布不随时间的改变而改变
弱平稳
:未来某个时刻的数值依赖于过去的信息,有其依赖性
差分
时间序列t时刻与t-1时刻的差值
注意:
一阶差分指的是t与t-1时刻差值,二阶差分是在一阶差分基础上再做一次差分,以此类推
AR
描述当前值和历史值之间的关系,需要用其自身的历史数据对自身进行预测
1、必须满足平稳性要求
2、p阶:若以天为单位,1阶表示当前和昨天计算,2阶表示和前天,以此类推
3、自相关系数γ小于0.5,不适合
MA
关注自回归模型的误差项,也就是对AR种的误差进行优化
ARMA
融合AR和MA的公式
所以,到现在为止,需要求p(自回归项)、q(移动平均项)、d(差分阶数)
ACF(自相关函数)
自相关函数反映了同一序列的数据在不同时刻的取值之间的相关性
PACF(偏自相关函数)
就是求ACF的时候,求出p=k,不是单纯的找出t和之前t-k单纯的两个时刻的相关关系
因为这其中会受到当前值t和之前k个值(t-1、t-2…t-k)的影响,所以需要剔除中间变量的影响
ACF包含其他变量影响,PACF是严格的两个变量之间的相关性
综合考虑
PACF—>p值
ACF—>q值
ARIMA建模三步走:
1、序列趋于平稳(差分法确定d)
2、p和q阶数确定:ACF、PACF
3、ARIMA
理清思路
传送门:
https://www.bilibili.com/video/BV1454y1v79B?share_source=copy_web
时间序列必然要带时间
会分为:
1、白噪声序列:也就是没有任何的规则
2、平稳非白序列:方差和均值是一个常数,可用AR MA ARMA
3、非平稳序列:差分变化后用ARIMA
--------------------------友善分割线,下文逐级操作--------------------------
传送门:https://www.bilibili.com/video/BV1Zz411e78y?share_source=copy_web
1、拿到待分析的数据
做好预处理,做好日期列(标准化)、数据列
⬇
2、检测平稳性
:单调的肯定不是平稳的,ACF没有趋向于0的,再看看ADF看其p值是不是大于0.05(大于就是非平稳序列)
不是平稳性序列,转换为平稳性序列(比如:差分) ➡ 差分后也要检测是否平稳(图像观察、ADF检测(p值))
⬇
3、白噪声检验
:通过LB进行检验,看其返回p值是否小于0.05(非白噪声)
白噪声就此停止,非白噪声继续进行
⬇
4、计算模型指标
:ARIMA模型:p、d、q
看ACF和PACF的图像是拖尾的还是截尾的,选取合适模型
⬇
5、参数调优
:不同p、q的AIC、BIC取值
要求BIC越小越好,AIC越小越好
⬇
6、参数建模+残差检验
:ARIMA建模
将残差进行ACF、PACF检测 或者 建立QQ图,看是否符合正态分布(正态分布会拟合出一条直线) 再用ADF和LB进行检验符合白噪声属于纯随机
⬇
7、预测
:预测未来数据