bagging和时间序列预测_基于大数据时间序列分析的铁路客流预测

6725a5c0b1c5720f55733f73c79ad688.png

摘要:随着我国高速铁路的快速发展,铁路客流预测已成为研究的一个重点方向。铁路客流预测有助于制定合理的价格,改善客运站组织,优化铁路车辆资源配置,提高客运设备的服务能力,对提高铁路客运效率具有重要意义。本文提出了一种基于时间序列分析的铁路客流综合预测模型。为了解决大数据环境下传统规划模型无法处理的问题,在解决方案中引入时间序列分析。将长期趋势因素、季节因素和天气因素相结合,建立了基于时间序列分析的铁路客流预测模型。以铁路局的铁路客流数据为例进行分析。研究了不同条件下的客流变化规律,预测了未来两周的铁路客流,提出了相应的车辆配置优化和车站停靠方案。灵敏度分析表明,该模型具有良好的稳定性和鲁棒性。

关键词:时序,预测,大数据,建模

1. 介绍

        随着我国高速铁路的快速发展,铁路客流预测的研究已成为重点研究方向。为了保持市场竞争力,实现利润最大化,铁路部门需要掌握铁路日客运量、淡季或旺季变化指数以及热门或冷门线路的具体情况。对客流的充分了解和可能的预测是准确把握市场的首要条件。

然而,很多因素都会影响铁路运输量。如“春运”期间铁路运输量的快速增长,导致铁路运输能力无法满足客户需求,给铁路客运组织带来巨大压力。通常,一些热门线路区间出勤率不足,造成铁路车辆资源的浪费。因此,铁路客流预测有助于制定合理的价格,完善客运站组织,优化铁路车辆资源配置,提高客运设备服务能力,这对提高铁路客运效率具有重要意义,在大数据环境下,以往的模型难以处理。针对以上问题,引入时间序列分析方法解决客流预测问题。

        Bartholomew和David Dickey在1971年和1991年提出了时间序列的定义。他们认为理论和方法是对线性时间序列模型及其在按时间顺序收集的数据建模和预测中的应用的系统阐述。目的是提供处理数据的具体技术,同时提供对这些技术的数学基础的透彻理解。Harvey[在1990年开始提供一个统一的、全面的结构时间序列模型理论。可靠和准确的状态预测将使运输管理系统能够动态地预测系统的未来状态,而不仅仅是对当前情况作出反应。准确、及时的客流分析可以为铁路运输企业合理安排和调整客运线路运营计划提供决策支持。然而,现有的用于短期交通状况预测的时间序列模型本质上大多是单变量的。一般来说,将现有的单变量时间序列模型扩展到多变量状态涉及到巨大的计算复杂性。面对典型的大城市正在进入网络化运营现状,目前没有实时获取的路段交通数据对其进行监控和限制措施带来了一定的困难。Wei在2004年提出了一种基于时空数据挖掘的铁路客流预测新方法。Zhu以2010年N天平均客流量为基础,构建了上海地铁日客流量ARIMA预测模型。Ding于2002年提出了智能交通系统交通流时间序列预测的新方法。在大数据背景下,建立基于时间序列分析的铁路客流综合预测模型具有十分重要的意义。

        本研究的主要贡献在于解决基于大数据时间序列分析的铁路客流预测问题。提出了一种综合考虑长期趋势因子、季节因子和天气因子的综合预测模型。该模型基于大数据背景下的时间序列分析,旨在解决大数据环境下铁路客流预测问题。并以铁路局的铁路客流数据为例进行分析。据此,根据预测结果,提出了相应的优化车辆配置方案和对接方案。灵敏度分析表明,该模型具有良好的稳定性和鲁棒性。论文的其余部分结构如下:第二部分介绍了问题的描述和解决问题的思路。第三部分介绍了铁路客流预测的时间序列分析模型。第四部分运用铁路局的实际数据进行案例分析。第5部分介绍了用于验证模型鲁棒性的灵敏度分析。第六部分以总结性讨论结束研究。

2. 问题描述

        客流预测技术是交通领域的研究热点之一。铁路客流的影响因素很多。时间、季节因素和天气条件对客流预测影响较大,难以准确预测铁路客流。在大数据背景下,对铁路客流进行合理的预测是可能的,但用一般的编程模型很难求解大数据。

        客流预测方法一般可分为相关模型预测方法和时间模型预测方法。相关模型预测方法是找出影响客流的因素,建立客流与各影响因素之间的函数关系,建立客流预测模型。未来相关因素的取值不确定,这将给后期预测带来一定误差。时间模型预测方法是以时间为自变量建立交通预测模型。时间变量是一个综合自变量,包括随时间变化的经济发展、人口变化、基础设施改善和旅游发展的组合。

        如何将相关模型预测方法与时间模型预测方法相结合,在列车出行、时区、车站、区间等条件下对铁路客流进行分析,建立综合时间序列模型,更准确地预测未来铁路客流,是一个值得思考的问题。如果能建立更准确的预测模型,有利于铁路部门合理定价,改善车站组织,优化铁路车辆资源配置,提高客运设备服务能力,这对提高铁路客运水平具有重要意义。

3. 铁路客流预测的时间序列分析模型

        时间序列(或动态序列)是指按发生时间排列的具有相同统计指标的数值序列。时间序列分析的主要目的是根据现有的历史数据来预测未来。

在现实中,时间序列的变化受多种因素的影响,其中一些因素起着长期的决定性作用,在时间序列中表现出一定的趋势性和一定的规律性,而另一些因素则起着短期的、不确定性的作用,所以时间序列显示出一些不规则的改变。时间系列变化大致可分为以下三种:

        (1) 趋势变化,是指随着时间的推移,这种现象在某一方向上呈现稳定上升、稳定下降或稳定的趋势。

        (2) 周期变化(季节性变化),是指受季节性影响,按照一个固定的周期呈现周期性波动的现象。

        (3) 随机变化,是指不规则因素受不规则波动影响的现象。

        时间序列通常是上述因素的组合。时间序列预测法是指利用变量的历史数据进行预测的方法。它是连续性原则的直接应用,通过确定变量的历史模式,并假设这种模式在未来同样有效。时间序列预测方法可用于短期、中期和长期预测。根据数据分析方法的不同

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值