城市公共交通常乘客通勤出行提取方法

最新推荐文章于 2024-09-20 20:46:14 发布

原创最新推荐文章于 2024-09-20 20:46:14 发布

· 1.3k 阅读

3 ·

版权

文章标签：

#python #机器学习 #人工智能 #大数据 #算法

研究通过公交与轨道多源数据，提出常乘客职住地识别算法，提取北京市回天地区通勤出行链，发现通勤与非通勤的时空差异，为预约出行和需求分析提供依据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章信息

《城市公共交通常乘客通勤出行提取方法》，2021年4月15日发表于《交通运输系统工程与信息》。

摘要

为挖掘公共交通通勤出行精准化特征，从追踪出行链的角度出发，利用公交与轨道多源数据研究乘客通勤出行提取方法。通过选取潜在职住地设置高频职住地集合，提出公共交通常乘客职住地识别算法，结合出行链起讫站点与职住地空间信息匹配提取通勤出行链，并将常乘客出行分为home-work通勤、work-home通勤和非通勤出行。以北京市“回天地区”公交与轨道出行链数据为例，提取常乘客通勤出行。结果表明：常乘客职住地识别率达到85.9%，常乘客通勤出行和非通勤出行在出行时空分布和出行方式上存在明显差异，通勤出行提取可为北京市面向常乘客开展“预约出行”并分析其出行需求动态特征变化提供依据。

介绍

本文研究面向公交和轨道交通中的常乘客，以北京市“回天地区”2 万多名常乘客30 d的出行链数据为例进行通勤特征挖掘，从非集计模型的角度，通过一定周期的出行链数据挖掘乘客出行链的时空分布规律，利用其中包含的内在关系和客观规律提出常乘客职住地识别算法，并根据出行链起讫站点和职住地空间位置匹配关系提取通勤出行链，分析常乘客通勤出行需求的时空分布及出行方式选择特征。该方法不受限于问卷调查，能够更准确地提取常乘客通勤出行。研究结果可分为北京市公共交通出行个体的动态出行特征精细化挖掘提供数据，对于提高职住分离地区的公共交通通勤出行效率具有重要意义。

具体介绍如下：

（1）本文考虑出行者全链条的出行行为，选用公交和轨道交通融合之后的出行链数据，同时研究对象由通勤个体转向通勤个体的通勤行为。

（2）本文提出了常乘客职住地识别算法，根据出行需求和实践特征客观规律选取潜在职住地，并从多日的潜在职住地站点中选取出现频率最高频站点作为高频职住地，进一步构建职住地识别条件，并总结出职住地识别流程。

（3）本文在常乘客职住地识别的基础上提取通勤出行链，将通勤出行分类，并将通勤出行链与职住地空间位置进行匹配。

（4）本文在应用通勤出行链提取方法的基础上，对北京“回天地区”通勤与非通勤出行方式、出发时间以及出行距离的分布特征进行分析，发现本文提出的通勤出行链提取方法的应用误差对比原有方法显著降低。

主体内容

数据基础

本文获取公交IC刷卡数据、地铁AFC系统刷卡数据和车辆GPS位置数据在内的北京市公共交通多源数据，数据采用已经完成公交与轨道换乘识别的出行链数据，该数据考虑了两种出行方式之间的衔接，能够完整展现出乘客的出行时空信息，如乘客ID号、出行链编号、上下站时空信息、换成信息和交通方式等。并将出行链结构分为仅乘公交、仅乘轨道交通、公交和公交之间换乘、公交和轨道交通之间换乘四种，分别表示为B、S、B-B、B-S。

居住地识别算法设计

居住地识别流程如下：

从常乘客单日出行链数据起讫站点提取首次出行起始站点和末次出行到达站点分别作为潜在居住地h1和h2，在考虑到存在首次出行即是末次出行的情况，选取的首次出行出发时间为上午时段，末次出行出发时间为晚间时段。

根据离开和到达居住地的不同出行需求提取的潜在居住地设置两类高频居住地H1和H2，从多日中提取的潜在居住地h1和潜在居住地h2中选取出现频率最高的站点分别作为集合H1和H2中元素。

从提取多日的潜在居住地h1 中选取出发时间最早的两个作为集合 H3 中的元素，从潜在居住地 h2 中选取到达时间最晚的两个潜在居住地作为集合 H4 中的元素。当有些站点出现频率相同时集合中元素可能不唯一，当高频居住地集合中站点元素唯一时，该元素作为真实居住地的可能性就越大；同时该元素应在其他集合中也存在，表明所设置的高频居住地更加符合出行需求从居住地出发或者到达的客观规律。鉴于此构建识别条件为：

当高频居住地集合 H1 满足识别条件式(1)时，H1 中唯一元素为居住地；满足识别条件式(2)时，H2 中唯一元素为居住地。居住地识别条件判断顺序如图1所示，最后输出该常乘客居住地为 Sh ，若不能满足识别条件则无法识别其居住地。

工作地识别算法设计

工作地识别流程如下：

对于典型通勤乘客，根据早晚高峰时段的出行选取潜在工作地w1，对于非典型通勤乘客，提取从居住地出发的到达站点和到达居住地的起始站点作为潜在工作地w2。从工作日多日提取的潜在居住地w1和潜在居住地w2中选取出现频率最高的站点分别作为集合W1和W2中元素。

当高频工作地集合中站点元素唯一时，该元素作为真实工作地的可能性就越大。同时该元素应在另一个人高频工作地集合中同样存在，表明所设置的高频工作地更加符合乘客通勤出行需求的客观规律。故判别条件为：

由于不同出行乘客在同一交通需求下具有交通方式、线路、站点选择的多样性，故根据公交、地铁站点服务半径及乘客可接受的步行距离设定距离约束ε，当两个高频工作地集合中站点元素都唯一但不相同时，通过两站点经纬度数据计算空间距离 l ，其表达式为：

（R为地球半径，xi和yi分别为出发和到达站点的经纬度坐标）

当空间距离 l 满足距离约束 ε 时，若满足将其识别为同一工作地的两个不同工作地站点，识别条件为：

当满足识别条件式(3)或式(6)时，W1 中唯一元素为工作地；满足判别条件式(4)时，W2 中唯一元素为工作地。最终输出识别结果为该常乘客工作地 Sw ，若不能满足识别条件则无法识别其工作地。

#提取通勤出行链

根据出行链的起讫站点和职住地站点的空间位置关系匹配将通勤出行链分为 home-work(HW)出行链和 work-home(WH)出行链两种类别。提取HW出行链和WH出行链的起讫站点分别构成向量Thw和Twh，构建条件判断式为：

当职住地站点与出行链起讫点不同但距离很近时，可视为同一地点：

根据站点服务半径设定距离约束ε，为避免无法分类通勤距离小于服务半径的出行链，增加提取HW、WH出行链的条件判断分别为：

应用案例分析

本文选取2019年9月在“回天地区”有乘车记录的约7万名乘客的公共交通出行链数据。提取通勤特征包括出发时刻、出行距离及出行方式，对比两种方法提取出20 d工作日中单日通勤特征相对误差分布原有方法将通勤者的出行提取为通勤出行，会给通勤特征提取带来显著误差，特别是在出行方式为公交出行和出发时间在 11:00-17:00 及出行距离不足 3 km 的出行，存在较大误差。