![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
时间序列
文章平均质量分 96
talle2021
这个作者很懒,什么都没留下…
展开
-
Pmdarima实现单变量时序预测与交叉验证
滚动交叉验证是在验证过程中不断增加训练集、并让验证集越来越靠近未来的验证方式。滑窗交叉验证就是使用窗内的样本作为训练集,窗右侧(或下方)的样本作为验证集而进行的交叉验证。通常来说,验证集上的分数最佳的模型过拟合风险往往最小,因为当一个模型学习能够足够强、且既不过拟合又不欠拟合的时候,模型的训练集和验证集分数应该是高度接近的,所以验证集分数越好,验证集的分数就越可能更接近训练集上的分数。在多个模型对比的情况下,我们可以只通过观察测试集上的分数来选定最佳模型。这个最佳模型往往是表现最佳、过拟合风险最小的模型。原创 2023-10-31 20:14:02 · 559 阅读 · 0 评论 -
VARMA模型的原理与实现
比如,当我们要预测标准普尔指数的变化时,典型的外生变量就是政府政策。**如下图所示,ARIMA模型假设一个变量的未来是由该变量的历史决定的,而我们可以将该假设拓展至所有变量:一个变量的未来是由该变量自己和所有其他变量的历史共同决定的。 在单变量时间序列中,一个时间点下只需要求解一个值,而在多变量时间序列中,一个时间点下会需要求解多个值,并且,不同变量之间的值应该是会互相影响的,否则没有必要强行组成多变量时序数据,但单变量时序模型只能处理一个变量和自己历史数据的关系,却不能处理变量与变量之间的联系。原创 2023-10-15 13:49:32 · 1780 阅读 · 0 评论 -
基于统计学库statsmodels实现时间序列预测
在读表格的这一部分的时候,首先会观察p值,确定是否有任何项的p值大于设置的显著性水平𝛼。很明显,对模型来说理想的状态是拒绝原假设、接受备择假设,因此在我们规定的显著性水平𝛼(0.05)下,如果有任意项的p值大于𝛼,则说明当前项的系数没能通过显著性检验,模型对当前项的系数没有足够的信心。相对的,01和03号模型的AIC较高,这两个模型都通过系数的单变量检验,但在残差的白噪声混成检验中出现问题,这说明这两个模型的项中没有多于的项、但模型却没能提取到足够多的信息,因此01和03号模型处于略微欠拟合的状态。原创 2023-10-13 20:03:39 · 964 阅读 · 0 评论 -
一文搞懂时间序列ARIMA模型
ARIMA模型的基本思想是:一个时间点上的标签值既受过去一段时间内的标签值影响,也受过去一段时间内的偶然事件的影响。即ARIMA模型假设为标签值是围绕着时间的大趋势而波动的,其中趋势是受历史标签影响构成的,波动是受一段时间内的偶然事件影响构成的,且大趋势本身不一定是稳定的。原创 2023-10-06 18:29:03 · 9428 阅读 · 0 评论 -
时间序列-AR模型与MA模型的原理与实现
AR(自回归模型)是最早、最淳朴的时间序列模型之一,它适用于“时间-标签”一一对应的单变量时序数据。AR模型的基本思想可以被概括为一句谚语:罗马城不是一日建成的,今天的结果一定依赖于过去的积累,因此AR模型相信:一个时间点上的标签值一定是依赖于之前的时间点上的标签值而存在的。这一基本思想包含了两个假设:在这两个前提假设下,AR模型将时间点之间的关系解构为:一个时间点上的标签值可以由过去某个时间段内的所有时间点上的标签值线性组合后构成(实际就是加权求和)。用数学公式表示则有:yt=c+β1yt−1+β2yt原创 2023-10-02 19:17:35 · 2363 阅读 · 0 评论