1- forecasting at scale论文阅读

本文介绍了时间序列的定义,包括点预测和区间预测,强调了定量预测的重要性。讨论了时间序列预测的前提,如预测的独立性和历史趋势的延续性。文章还详细讲解了预测的两种基本范式,涉及观察值和外部变量,并提到了时间序列分析中的专有名词,如观察值和外部变量。最后,着重指出评估预测性能的方法,如回测与避免dataleak问题。
摘要由CSDN通过智能技术生成

1. 什么是时间序列

按时间先后顺序出现的有序序列
在这里插入图片描述

2. 什么是时间序列预测

在这里插入图片描述

  • 点预测:预测未来的某一个时间点,它的值到底是多少,例如明天的收盘股价、最高温度等。
  • 区间预测:明天的温度范围,例如-8~4°,落在这个范围的概率是多少

在这里插入图片描述
时间序列预测,不仅可预测,还要可定量预测。例如股票,你除了告诉我明天股票会涨,还要告诉我明天能涨多少。本博客介绍内容为定量预测

时间序列预测的前提:
在这里插入图片描述

  • 预测不会影响试图预测的结果:例如你预测股票明天涨幅10%,结果很多人听说该消息之后,没等涨到10%就开始抛售,导致股票跌了。
  • 过去的一些模式会在未来延续下去:过去的一些模式在未来一定会延续下去,我们一定是由于历史上出现了这样的时间序列趋势,所以我们才认为它未来有可能出现类似的趋势。例如2019年年底出现了新冠肺炎,导致2020年初每股有大通盘,这是黑天鹅事件。2020年一整年经济不好,对今天有很大影响。那如果想通过2019年以前的数据来预测2020年经济会不会出现崩盘,显然是不可能的。

3. 时间序列预测的范式

两个公式就是两个范式

  • y t y_t yt是观察变量,例如股票价格,工场的销量等。要通过历史的销售量 y t − 1 y_{t-1} yt1 y t − 2 y_{t-2} yt2等来预测未来的销售量。 ϵ \epsilon ϵ表示误差。
  • 第二个范式, x t x_t xt称之为影响观察值的变量,又称为外部变量。
    在这里插入图片描述
    上式(1)和(2)为基本范式,在此基础上可以衍生出各种各样的范式,如下举例:
    在这里插入图片描述

4. 时间序列的专有名词介绍

理解专有名词,提高学习时间序列、看论文的效率。

  • 观察值: y t y_t yt
  • 外部变量: x t x_t xt,可能随着时间变化,也可能不随时间变换。
    在这里插入图片描述

5. 时间序列评估

无论哪种预测,都要对预测效果进行评估;通过评估,才能对模型进行优化和迭代。
不能做交叉验证;

  • back test:也叫回测,意思是我用前面一段时间的数据做训练,后面一段时间的数据来做预测,这样就可以保证两边数据是没有交集的。不能出现训练数据中用到了未来的数据。
  • data leak:用2021和2023的数据做训练,去评估2022,也就是用未来的数据做训练,去预测过去,就是data leak。
    在这里插入图片描述
    14:30
  • 25
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值