基本概念
时间序列数据:
是指一个数据序列,在时域上存在相互依赖的关系
前提假设:
时间序列分析一般假设我们获得的数据在时域上具有一定的相互依赖关系,例如股票价格在t时刻很高,那么在t+1时刻价格也会比较高(跌停才10%);如果股票价格在一段时间内获得稳定的上升,那么在接下来的一段时间内延续上升趋势的概率也会比较大。
目标:
(1)发现这种隐含的依赖关系,并增加我们对此类时间序列的理解;
(2)对未观测到的或者尚未发生的时间序列进行预测。
我们认为时间序列由两部分组成:有规律的时间序列(即有依赖关系)+噪声(无规律,无依赖)。所以,,接下来要做的就是过滤噪声—接下来利用指数平滑来对数据进行处理
不管是几阶指数平滑,都需要设置初值,设置初值的方法:
假如数据大于20项,那么初值就可以认定为第一个数据;假如数据小于20项,就取待处理数据的前三项的真实平均值作为初始值
一阶指数平滑
一次指数平滑一般应用于直线型数据,且一次指数平滑具有滞后性,可以说明有明显的时间性、季节性。
一次指数平滑需要滞后一期,给定平滑系数alpha,那么一次指数平滑的计算公式为: