微信公众号“圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
后台回复“交流”加入“圆圆的算法笔记”交流群;回复“时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~
论文标题:Retrieval Based Time Series Forecasting
下载地址:https://arxiv.org/pdf/2209.13525.pdf
今天为大家介绍一篇CIKM 2022中比较有意思的时间序列预测论文。这篇论文的独特之处在于,在其他论文都在卷深度学习时序预测模型结构时,这篇文章从检索引入相关数据的角度解决时序预测问题。
1. 核心思路
如果我们把时间序列预测看成一个数据补全问题,那么预测窗口长度占序列总长度的比例就决定了预测结果的不确定性有多大。因为缺失数据占比越多,对序列的补全就越发困难。这种情况下,单纯的优化模型结构也无济于事。因此,本文的核心思路为,当数据缺失比例较高时,能不能从其他时间序列中检索出一些相关的,作为一种信息补充手段,侧面缓解数据缺失度高的问题,降低预测的不确定性。
2. 基于检索预测有什么好处?
文中使用了单独一章的篇幅,从理论的角度分析引入检索序列作为信息补充,能够带来的预测效果增益。整体的论证包括3个步骤(X表示输入的有缺失值序列,\hat{X}表示模型预测的序列,\tilde{X}表示真实的无缺失值对的序列,Y表示检索的额外序列):
- 预测结果的不确定性等价于MSE:预测结果的不确定性定义为,给定预测结果下真实结果的的条件熵,可以证明这个熵就等价于预测结果和真实结果的MSE </