时间序列(time serie)分析系列之简介1

本文介绍了时间序列分析的基础知识,包括时间序列数据的定义,常见应用,以及分析过程中的趋势、季节性和残差成分。文章讨论了如何将时间序列问题转化为其他类型的问题,并列举了多种时间序列预测方法,如平均法、SARIMAX、ARIMA、Prophet以及机器学习和深度学习算法。作者鼓励读者深入学习并分享经验。
摘要由CSDN通过智能技术生成

一、简介

笔者在工作中,接触到了客流数据,网络质量数据等,零零散散的对时间序列分析方法进行了学习和实践。
在平时的工作中,大多数公司都会有很多时序数据,也都离不开时序数据的挖掘。
所以现在整理分享出来,忘大家批评指正。


二、什么是时序数据

时间序列数据(time series data)是在不同时间上收集到的数据,用于描述现象随时间变化的情况。
时间序列是一种典型的数据,具有随时间变化的特征。在大多数场景中,都能见到的一种数据类型。
如客流数据,股票数据,销售额数据,网络日志,某些KPI指标等等内容。

Time Value
2018-11-01 2222
2018-11-02 3241
2018-11-03 4232

这里有些数据集可以下载:time series datasets


三、时间序列的分析

一般情况下,时间序列数据可以分解为3个部分,如下图所示:

  • Trend,数据的总体变化趋势
  • Seasonality,数据的周
  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
原创时序分析timeserieanalysis模型的应用parte1-TimeSerie_Concha.rar 【问题描述】:我们现在有某年的某机构的某数据,这些数据每15分钟采集一次,于是一年之中我们可以得到365天*24小时*4=35,040个点。相当于我们有一个365*96的矩阵,(在这里我们的数据是不完整的,只到10月份,故而我们有一个306*96的矩阵)。下图一为一年范围的时序信号,然后下图二是一个星期范围内的时序信号。相信大家不难看出,每逢周末的时候的数据要比平时小很多,这说明它具有完全不同的行为特征,需要单独拿出来考虑。然后再仔细观察一些,我们还可以发现会有一些天(例如周三)具有和其他周三不同的特征,我们猜测的是可能这个星期是假期或者其他什么原因,而这些outlier我们是需要适当的将他们修正的。我们的任务是预测每天的平均量。 1-1.JPG 2-1.jpg 这一年的日历表: 3.JPG 【问题的解决】:我们考虑使用AR,MA或者ARMA模型来拟合我们的数据,具体模型建立步骤为: 前提假设:一周的每天都有自己的独立的模型,因此需要将现有数据中的每一个周一,周二只到周末都提取出来,然后对它们分别进行模型建立。 这里我们以周三为例: 1. 原始周三信号为X,提取出X的趋势Trend。 关于趋势的去除方法有很多种,我们这里应用的是论坛上讨论过的SPA 和EMD。 2. 由第一步可以到residual = X - Trend。对这个residual信号进行IID测试,通过的话,我们就可以在这个residual信号基础上建立AR或者MA或者ARMA模型,如果没有通过的话,那就要回到第一步,寻找更好的可以去除趋势的信号。 3. 通过计算residual信号的autocorrelation(AC)和partial autocorrelation(PAC)我们就可以确定模型的类型了(这里就不再赘叙如何确定了,感兴趣的朋友可以自己查阅相关资料)。一旦确定了模型类型,我们就可以使用相关的算法来得到模型参数。例如对于AR模型我们可以使用Burg或者Yule-Walker算法等等啦。 4.假定在步骤三中我们得到一个AR模型即residual = a1*residual noise ~WN, 那么我们就可以开始预测啦! 5. 最终预测结果 = residual    Trend, 注意这里有一个问题就是比如我们知道了时间1:40的数据值,现在想要预测41:43时间段的值,那么其实主要的预测走势是跟着趋势走的,我用的多项式拟合的方法得到趋势在时间段41:43的值的,得到趋势的大体走势之后,再加上residual的模型预测值,我们就得到了所需要的预测结果啦,一般来说误差都不会太大。 【时间结果】:还是以周三为例吧。先给一下去趋势前后的周三数据的图像吧。 4.jpg 4-1.jpg 再给个预测结果图吧 5.jpg 【代码】:程序其实蛮简单的,主要在于思想。具体函数的使用请参照main.m.谢谢 【后期工作】:以上所阐述的问题属于长时间范围内的预测,如果我们想要做短时间的预测,比如我想知道5月8号22:15的时候的数据量,那么我们的模型假设又要重新考虑啦。这个问题的解答过段时间再传到论坛上吧。欢迎大家留言讨论啊!!! TimeSerie_Concha.rar
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Great1414

整理不易,谢谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值