SPSS(十九)SPSS之时间序列模型(图文+数据集)
时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。正如人们常说,人生的出场顺序很重要,时间序列中隐藏着一些过去与未来的关系。时间序列分析试图通过研究过去来预测未来。
时间序列分析在工程、金融、科技等众多领域有着广泛的应用。在大数据时代,时间序列分析已经成为 AI 技术的一个分支,通过将时间序列分析与分类模型相结合,更好的应用于数据检测、预测等场景。
时间序列模型简介
- 依时间顺序排列起来的一系列观测值(观测值之间不独立)
- 它考虑的不是变量间的因果关系,而是重点考察变量在时间方面的发展变化规律,并为之建立数学模型
- 使用时间序列模型的前提:有足够长的数据序列;数据序列的变动是稳定而规律的
另外一种理解方式:假如我们对一件事情研究其背后规律很久的话,可以收集到很多的自变量/影响因素去研究与因变量之间的关系,但是由于各种原因我们做不到,我们只能用一个t(时间)来替代所有的影响因素来研究自变量是如何变化的
时间序列分析面临的问题
时序应该在现实生活中应用的很广,但是为什么不常用这个模型呢?
- 基础统计数据原因(数据收集)
报表系统——质量问题
统计口径——不统一
范围变化、区域划分——变化
- 理论和技术培训原因
之前没有好的工具来实现时间序列模型
时间序列的方法分类
- Time domain(最为常见的方法):将时间序列看成是过去一些点的函数,或者认为序列具有随时间系统变化的趋势,它可以用不多的参数来加以描述,或者说可以通过差分、周期等还原成随机序列。
- Frequency domain:认为时间序列是由数个正弦波成份叠加而成,当序列的确来自一些周期函数集合时,该方法特别有用。 比如心电图
时间序列的构成
并不是每个序列都包含所有4种成分。比如以年为时间单位的序列就不会有季节变化;
一些较短的序列也看不出循环变化。所以在分析的时候得具体情况具体分析。
- 长期趋势
指一种长期的变化趋势。它采取一种全局的视角,不考虑序列局部的波动
下图,整体呈下降趋势
- 季节变化(Season)
反映一种周期性的变化一般在一年中完成
虽然称作“季节”,但是周期并不一定是季度,也可以是月、周等其它能在一年内完成的周期。因为,大多数的周期都以季节的形式出现,所以称作季节变化
比较典型的季节变化例子:圣诞节效应;冷饮的销售情况
- 循环变化(Cyclic)
循环跨度超年
指一种较长时间的周期变化。一般来说循环时间为2-15年。循环变化一般会出现波峰和波谷,呈现一种循环往复的现象。
比如:经济危机
- 不规则变化(error)
指时间序列中无法预计的部分,也可以理解为误差
序列的随机波动
突发事件引起的
它是无法预测的
在分析中往往又将其称为白噪声
它是时间序列中除去趋势、季节变化和自相关性之后的剩余随机扰动。由于时间序列存在不确定性,随机噪声总是夹杂在时间序列中,致使时间序列表现出某种震荡式的无规律运动。
比如:911事件
时间序列分析对长度的要求
- 不同的序列分析方法对时间序列分析对长度不一样,建模过程一般都会做差分,差分会损失信息,差分得越多,相应要求的时间序列越长
- 如果是稳定序列的话,历史数据越多,对预测的帮助越大
- 如果存在周期,一般需要4个周期以上;数理上认为应当在20个周期以上