时间序列分析

1.时间序列分析的定义

对于时间序列,一般来说的定义是X_{t}\left \{ t\subset T \right \}其中X_{t}X_{t+1}的间隔是相同的,大致翻译就是对于同一指标的数值,按照其发生的时间而排列而成的序列,它的主要目的,就是为了去根据已有的数据,对未来进行预测(和马尔科夫链的定义很相像,因为马尔科夫链确实可以看作是一种特殊的时间序列)

2.自相关分析:

对于时间序列分析,自相关是重要的分析工具,它指的是不同时间的观察值的相关性,可以识别时间序列是否是稳定,是否存在季节性

import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
 

ts = pd.Series(data)
 

acf = sm.tsa.acf(ts, nlags=len(ts)-1)
 

可通过下述代码直接获得稳定性

result = sm.tsa.seasonal_decompose(ts)
trend = result.trend
seasonal = result.seasonal
residual = result.resid
 

对于平稳的数据集,我们一般采取自回归平均移动模型,但是对于非平稳的数据集,我们要先进行差分处理,再使用自回归平均移动模型

3.平稳性

平稳性指的是对于我们的观测值来说在不同时间点观察到的时间序列,是否统计特性保持不变,统计特性指的是数据的方差,均值和自相关性,一般来说,严格稳定的平稳性是不容易找到的,我们一般讨论的是弱平稳性,也就是方差和均值可能变化,但自相关性保持不变。

4.序列分解

1.长期趋势

指的是现象在较长时间内受根本性原因影响而形成的一种变化趋势

2.循环趋势

循环趋势是指时间序列中较长周期的波动

通常长期趋势和循环趋势可使用「线性回归」「Holt线性趋势模型」「Holt-Winters非线性趋势模型」等来建模和预测

3.季节变动

现象在「一年内随着季节的变化」而发生的有规律的周期性变动 

4.不规则变动

是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型。

5.预测模型

1.统计模型

1、使用平滑技术进行时间序列预测

  • 指数平滑
  • Holt-Winters 法

2、单变量时间序列预测

  • 自回归 (AR)
  • 移动平均模型 (MA)
  • 自回归滑动平均模型 (ARMA)
  • 差分整合移动平均自回归模型 (ARIMA)
  • 季节性 ARIMA (SARIMA)

3、外生变量的时间序列预测

  • 包含外生变量的SARIMAX (SARIMAX)
  • 具有外生回归量的向量自回归移动平均 (VARMAX)

4、多元时间序列预测

  • 向量自回归 (VAR)
  • 向量自回归移动平均 (VARMA)

2.机器学习

神经网络模型:

神经网络在时间序列预测中的应用已经得到广泛的研究和应用。其中,常见的神经网络模型有「多层感知器(MLP)」「循环神经网络(RNN)」「长短期记忆网络(LSTM)」「卷积神经网络(CNN)」等,通过对时间序列的历史数据集进行训练分析,学习到内在规律和特征,从而对未来指定的时间段(点)进行预测。。

「优点」:相较于传统方法,神经网络模型在处理「非线性、非平稳、噪声较大」的时间序列上具有更好的效果能够处理非线性关系和复杂的时间序列数据,适用于「大规模数据」的建模和预测,具有一定的「自适应性」

「缺点」:模型「参数(and 超参数)调整」较为困难;「数据处理量」和计算资源要求较高;对于小样本数据可能会「过拟合」导致预测结果偏离期望预测。

集成算法模型:

集成学习算法是一种将「多个学习器集成在一起」以提高模型准确性的技术在时间序列预测中,集成学习算法包括了「垂直集成方法(如Bagging和Boosting)」「水平集成方法(如Stacking和Blending)」。通过集成不同的模型来获得更加准确的预测结果。

集成学习算法的优点在于能够「减少模型预测误差、提高模型的泛化能力」,更好地适应于「复杂、动态」的时间序列预测场景

3.统计模型优缺点

简单平均法:
优点:简单易懂、易于计算。
缺点:对异常值敏感,不考虑趋势和季节性,适用性较差。

移动平均法:
优点:消除了季节性数据的噪声,对趋势进行了平滑处理,简单易懂。
缺点:滞后性较大,可能不能很好地捕捉到快速变化的趋势。

指数平滑法:
优点:对近期观测值赋予较高的权重,能够较好地适应趋势的变化。
缺点:对季节性和周期性数据预测效果较差。

Holt线性趋势法:
优点:能够适应线性趋势,预测效果较好。
缺点:不能很好地处理非线性趋势。

Brown双重指数平滑法:
优点:能够较好地捕捉到趋势的变化,对季节性和周期性数据预测效果较好。
缺点:对异常值和趋势变化较为敏感。

季节性指数平滑法:
优点:能够很好地捕捉到季节性趋势、适应不同时间周期的季节性变化。
缺点:较复杂,对数据的周期性要求较高。

ARIMA模型:
优点:能够较好地捕捉到时间序列数据的自相关和趋势性,适用范围广。
缺点:对数据稳定性要求高,只适用于线性模型,难以处理非线性关系。

季节性ARIMA模型:
优点:在ARIMA模型的基础上考虑了季节性,适用于处理具有季节性趋势的时间序列数据。
缺点:对数据的稳定性和季节性要求较高,不适用于非线性关系。

X-11季节性调整方法:
优点:能够对季节性时间序列进行较精确的分解和预测,适用性较强。
缺点:计算复杂,需要较长的历史数据,并且要求数据具有明显的季节性趋势。

 

  • 32
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值