对于利用经验模态分解+LSTM/BP组合模型对时间序列预测的一点想法

文章讨论了在时间序列预测中数据预处理步骤,特别是训练集和测试集的划分以及模态分解的影响。作者发现先分解后划分的方式可能导致数据泄漏,影响预测精度。尝试ARIMA+LSTM的组合模型后,效果有所改善。作者指出,使用模态分解方法可能会包含未来信息,不适合预测,并提出这可能是数据泄漏的一个来源。
摘要由CSDN通过智能技术生成

老师给研究思路后,看到本领域有相关论文是用类似组合模型对时间序列进行预报,因其论文内对训练集和测试集的划分不是很明确,一直有这个疑问:是否存在数据泄漏?于是首先采用了先划分训练集和测试集,然后分别对训练集和测试集进行分解,再训练模型进行预报,结果不尽如人意,误差极大甚至不如单独的LSTM模型或是BP模型;之后又尝试了对整个数据集进行分解,然后再划分训练集和测试集,结果精度出乎意料的高。针对这个问题,查阅了一些博主的分析,比如这位博主写的。https://blog.csdn.net/JasonDean/article/details/122396431?spm=1001.2014.3001.8078#comments_21105533

之后我不确定已发出的论文在训练集、测试集划分和模态分解的先后顺序上是否有问题,和老师进行了讨论,老师的意思差不多是水出来一篇没太大问题,但我不会让你这么写,于是放弃了,转而使用ARIMA+LSTM分别针对线性主要成分以及非线性残差做预测,效果还不错。

最近在写文献综述时又考虑到这个问题,突然想到,先不谈他划分与分解的问题,还存在其他的数据泄漏可能。

我们做时间序列预测,通常采用前m个数据来预测后n个数据,其训练集重构为监督学习的形式就是:

X                     Y

t-1,t-2,...          t,t+1,...

此时训练集并非为原始数据集,X、Y应由分解后的某个imf分量重构得到,t-1,t-2,...时刻的X、Y序列必然包含原始数据集t,t+1,...时刻的信息,个人认为这种模态分解法不适合应用于时间序列的预测。

权当写给自己的笔记了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值