数据挖掘#道路流量预测的一些思考(时序数据相关)

本文探讨了道路流量预测中的时序数据分析,介绍了时间序列的构成要素和处理方法,如ARIMA模型。提出了结合XGBoost和LSTM的预测思路,涉及数据预处理(如log变换、离散特征编码)和处理缺失值的策略,为预测提供综合解决方案。
摘要由CSDN通过智能技术生成

实习之后一直很好奇公司的道路情况预测模型是怎么构建的。找到一些资料有了一点业内的概念,结合相关数据挖掘赛题数据,动手做了一点东西,稍微总结一下。

使用模型

XGBoost,LBM,LSTM

模型倒是其次,总结想落在关于时序数据的处理过程。

传统时间序列处理

定义

时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。

构成要素

时间序列可以分为长期趋势(trend)、季节变动(seasonal)、循环变动(cycling)和随机波动(irregular)四个部分。

  • 长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势
  • 季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动
  • 循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动
  • 不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型

由于实验室处理数据大多是金融时间序列的原因,第一开始想到的做法大概是AR、MA、ARMA、ARIMA等等。

时间序列分析是机器学习中常见的一种类型。经常用来以下几种问题:

  1. 销量预测 2. 金融分析

时间序列分析这个领域内通常有两种解决问题的方式:

  • 谱分析:通过傅里叶变换将时域变换到频域,然后对频域数据进行分析
  • 时域分析:从序列自相关的角度揭示时间序列的发展规律

目前常

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值