【时间序列数据挖掘】ARIMA模型

目录

0、前言

一、移动平均模型MA

二、自回归模型AR

三、自回归移动平均模型ARMA

四、自回归移动平均模型ARIMA

【总结】


0、前言

传统时间序列分析模型:

ARIMA模型是一个非常灵活的模型,对于时间序列的好多特征都能够进行描述,比如说平稳性特征,季节性特征,趋势性特征。

ARIMA模型可以通过非常成熟的统计方法,比如说极大似然估计,矩估计,贝叶斯估计或者其他一些估计方法得到估计,所以是一个非常好用的工具。

ARIMA模型分成了三部分:AR,I,MA,相当于三个模块的组合。

大家比如说,如果拿到一个时间序列,最想干什么。

如果是一个股票数据,最关心的当然是需要能够知道时刻t~t+h的收益是什么样子的,即期望,

还有方差,作为一个投资者,比如预期我能赚1000万。如果方差是500,那我应该要好好考虑一下我有没有足够的把握能够控制住这个方差,赚到这个1000万。方差不确定性,就能够帮我们甄别做一件事情的风险有多大,计算公式如下:

平稳时间序列一个随机现象的统计特征不随时间变化而改变的随机过程。

非平稳时间序列: 时间序列自身的随机过程的统计特征随时间改变。

一、移动平均模型MA

MA(q):假设一个时间序列由噪音(误差项)以及这些噪音的滞后阶按照不同权重组合起来。计算公式如下:

MA(q)是说,yt是和误差项以及误差项的历史阶受影响的。移动平均模型关注的是自回归模型中的误差项的累加。

二、自回归模型AR

 一般的P阶自回归模型 AR:

 如果随机扰动项是一个白噪声( ut=εt ),则称为一个纯AR(p)过程,记为:

自回归模型AR(p):假设今天的股票收益仅依赖于前天的股票收益,或者是依赖于前p天的股票收益,除此之外不依赖。那么前p天影响到了今天的股票收益。计算公式如下:

自回归模型首先需要确定一个阶数p,表示用几期的历史值来预测当前值。

但是,自回归模型有很多的限制:

(1)自回归模型是用自身的数据进行预测;自回归模型描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。

(2)时间序列数据必须具有平稳性;

(3)自回归只适用于预测与自身前期相关的现象(时间序列的自相关性);

三、自回归移动平均模型ARMA

可以这样理解,如果你经营一个餐馆,今天餐馆的收益和昨天的收益有关系,同时还受市场上发售的消费券的影响(假设消费券是一个随机数的话)。因为我不知道市场发了多少消费券,所以假定消费券是一个随机数。

那么你会发现,那么餐馆的经营既和过去一段时间的业绩有关系,又和消费券的随机数有关系。

那么这两个东西全部综合起来,我们把它叫做自回归移动平均模型ARMA,既有自回归模型AR,又有移动平均模型MA。计算公式如下:

ARMA本质上是一个线性模型,但是它非常灵活,它能够帮助我们描述很多不同的场景。由于它是一个递归的形式,可以通过递归的形式来预测yt-1,yt-2,yt-3,所以ARMA模型是一个非常非常有效的基准的时间序列检测工具。

四、自回归移动平均模型ARIMA

现在,我们想想这个“I”是什么东西,“I”是一个差分项。

也就是说任何一个时间序列,你拿到之后,你需要想一想它是不是平稳的。如果不是平稳的,那么我们需要进行差分,即d=1,yt-yt-1就是差分之后的形式。

这里的p是自回归模型AR的参数,q是移动平均模型MA的参数,d是指d阶差分。

因为差分后的时间序列往往有更好的平稳性,那么差分后的时间序列就可以更好的用ARMA模型来建模。

ARIMA(p,d,q):假设今天的股票收益不仅依赖于前p天的股票收益,同时还与消费券有关。

除了差分, 比如说还有Box-Jenkins方法,是一个比较主观的工具。但是它对于较长的时间序列不是很好用,然后呢还有一些检验上的问题都很难被处理。

差分:将不平稳的时间序列变平稳。

Box-Jenkins方法:通过查看acf和pcf来识别这个时间序列是不是平稳的。

样本自相关函数(autocorrelation function,ACF):展现t时刻和t-k时刻时间序列的关联性,描述的是时间序列观测值与其过去的观测值之间的线性相关性。

样本 偏自相关函数(partial autocorrelation function,PACF) : 在给定了 的条件下, 𝑦t 与滞后 𝑘 期时间序列之间的条件相关。
 

PACF描述的是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。

举个简单的例子,假设k=3,那么我们描述的是yt和yt-3之间的相关性,但是这个相关性还受到yt-1和yt-2的影响。PACF剔除了这个影响,而ACF包含这个影响。

【总结】

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
ARIMA(自回归移动平均模型)是一种用于时间序列分析和预测的经典模型。在数据挖掘中,ARIMA模型被广泛应用于气温预测。 ARIMA模型有三个主要的参数:p、d和q。p表示自回归项(AR),即当前值与过去p个时刻的值之间的关系;d表示差分项(I),即进行d次差分以使时间序列变得平稳;q表示移动平均项(MA),即当前值与过去q个时刻的预测误差之间的关系。 在进行气温预测时,首先需要对时间序列数据进行分析和预处理,确保数据的平稳性。然后,可以通过查看自相关图(ACF)和偏自相关图(PACF)来确定ARIMA模型的参数。这些图可以帮助确定p、d和q的最优值。 一旦确定了ARIMA模型的参数,可以使用历史气温数据来拟合模型。拟合完成后,可以使用ARIMA模型生成未来一段时间的气温预测。预测结果可以与实际观测值进行比较,评估模型的准确性。 ARIMA模型在气温预测中的应用有一定的局限性。气温受到许多因素的影响,包括季节性、长期趋势、天气变化等。ARIMA模型只考虑了时间序列自身的关系,对于这些外部因素无法很好地捕捉。因此,在进行气温预测时,还需要结合其他模型或方法,如回归模型、神经网络等,以提高预测的准确性。 总结来说,数据挖掘中的时间序列气温预测可以使用ARIMA模型。首先确定模型的参数,然后拟合模型,并生成未来一段时间的气温预测。但需要注意ARIMA模型的局限性,需要结合其他模型或方法来提高预测的准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

水w

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值