【前沿进展】基于手机信令数据的交通出行特征研究

0 概述

12月11日,中山大学智能工程学院副院长蔡铭教授来单位做报告,汇报基于手机信令数据的交通研究技术方法,很受启发。

我认为,蔡教授团队研究出发点是如何应用手机信令这一大数据来构建完整出行链,以解决交通出行中的诸多问题,如出行的起点、终点,出行的线路选择,出行方式,出行用户画像,人车关联。研究亮点之一是其综合使用多种数据、技术,有效提高算法精度,其二是建立开源的真值数据库,为验证算法准确性、可靠性提供有力参照。

技术方法可以参考现有的较为常规的做法,但不过过于迷信于此,需要多思考如果也照那样做会存在什么纰漏,是否能有更好的做法,在这样思考的过程中,不但能够提升结论可靠性,也是诞生新的研究idea的契机。

在这里插入图片描述

1 手机信令数据预处理

手机信令价值密度低,需要进行数据清洗方能减少误差,降低冗余度,这能够提升结果准确性,也能大大减轻数据处理所花费的计算资源及时间。蔡教授团队设计一种层次化数据清洗流程,可以提炼有价值数据,同时实现数据预处理工具可复用性。整个处理流程包含以下步骤:

  1. 残缺数据筛除
  2. 同时间不同位置处理
  3. 同位置点合并
  4. 乒乓切换数据处理
  5. 漂移数据处理

经过预处理后,数据量减少了92%左右。

在这里插入图片描述

2 手机信令数据分析应用

2.1 停留点识别

停留点是出行链节点,传统的停留点识别算法需要凭借研究者经验手动设定固定的时间阈值、空间阈值,存在较大主观性,蔡教授团队提出一种基于时空密度聚类的停留点识别算法,以地面二维平面及时间维构架出时空三维坐标系,对出行数据中的时间和空间特征进行了整合,结合个体出行轨迹特征设置初始代价,不再设施固定时空阈值。

在这里插入图片描述

2.2 职住地分析

传统职住地分析需要人工定义职住时间段, 比如认为凌晨00:00-6:00是居家休息时间段,这种筛选方法大多数情况下有效,对于一些特殊工作模式如昼夜颠倒、无固定职住则不够准确。

蔡教授团队提出的职住地分析方法流程如下:

  1. 定义主要活动区:对用户多日活动轨迹点聚类,识别用户主要活动区域
  2. 识别工作、休息时间段:引入活动强度信息熵指标来衡量分析用户活动强度
  3. 提取工作、休息时段的主要停留区域:在区域内进一步划分网络,结合POI数据精准识别职住地所在网格(概率分布,打分?)。

在这里插入图片描述

2.3 出行方式识别

如何判别用户出行选用何种交通方式,蔡教授团队提出一种基于时空关联匹配的出行方式识别方法,该方法通过关联分析手机信令轨迹数据及高德地图导航数据,量化信令轨迹与各类导航路径相关强度,判别用户出行方式。具体流程如下:

  1. 导航轨迹请求:请求同一OD同一时间步行、公交、驾车、骑行4种出行方式导航路径。
  2. 导航数据匹配:权重计算——>路径匹配——>时间匹配——>综合对比

蔡教授表示,该方法在长距离通行情况匹配结果较好,短距离通行受限于手机信令数据空间分辨率低结果不是特别准确。由于该方法需要大量导航数据,团队是通过申请多个企业号的方式解决。

在这里插入图片描述

在找出与用户信令轨迹最为匹配的导航路线基础上,采用中文分词算法对路线信息做切分,得出个人出行画像,主要包含了主要出行方式、活动热点区域、公交线路等。

在这里插入图片描述

2.4 交通小区划分

为啥要划份交通小区:

  • 降低城市交通系统复杂性,是统计人口、居住就业、交通出行等方面的基础空间单元
  • 微观层面,方便城市管理者对每个区域进行交通管理和控制。
  • 宏观层面,对城市的交通区域进行协调以及规划

在这里插入图片描述

蔡教授团队提出基于多源数据的交通小区划分方法

  1. 基础小区:道路、水系、行政区等GIS数据提取小区
  2. 小区再细分:道路、狭长、冗余小区等多种异常小区的识别及清洗

在这里插入图片描述

2.5 公交特征分析

对公交评价体系重新做了思考,将国标中的一些指标替换成新数据环境下更加准确、人性化的指标。

  • 候车时长
  • 公交出行满足率
  • 站点步行距离
  • 公交可达性
  • 拥挤程度指标

在这里插入图片描述

2.6 人车轨迹关联

高级!!!

一个特别酷炫的应用场景:只需要在道路卡口拍一辆车的车牌,就能分析出车上坐了哪些人,即使后排乘客没有露脸。

在这里插入图片描述
蔡教授团队应用道路卡口数据描绘车辆轨迹,将信令轨迹与车辆轨迹做匹配分析,分析出车辆乘坐人员情况。所应用的算法为时空滑动窗口匹配算法,算法的具体步骤为:

  1. 对每个一开口点进行搜搜,看信令数据中是否存在时空阈值范围内的数据,否则匹配失败
  2. 将满足情况情况的手机ID记录下
  3. 下一个卡口阈值范围内是否有相同手机ID,无则匹配失败
  4. 不断循环搜索卡口点,若直到最后一个轨迹点都还有对应用户的话,那此车匹配成功

在这里插入图片描述
匹配结果不是特别理想,但有初步结果:

在这里插入图片描述

3 手机信令数据分析结果验证

算法准确性验证是算法开发中非常有必要进行的步骤,它能测算算法性能和有效性。

手机信令数据最大优点是全时空跟随性,缺点在于以基站位置代替实际位置会造成较大误差,为了能够验证算法准确度,蔡教授团队开发数据采集APP,以GPS数据作为真值数据,记录用户出行方式、停留状态、职住状态等。

蔡教授表示,目前该APP主要是团队内学生使用,出行方式单一,轨迹数据较少,考虑将此APP开源,以建立信令数据验证数据库,搜集更多的真值数据。

在这里插入图片描述

4 展望

5G网络的频率要比4G网络快得很多,但是频率越大的基站,它的衰减就会越快,为此基站的密度就要比原来的密。目前为止三大运营商都已经做出了自己的大体部署,联通家的基站密度大概是原来的3到4倍,移动家的达到了六倍左右,电信家的也是三倍以上。

随着5G时代到来,更高覆盖密度的基站也意味着信令数据空间分辨率将大大提高,这对基于信令数据的交通研究是个极大的利好消息,这是个很有前景的研究领域。

请添加图片描述

  • 9
    点赞
  • 70
    收藏
    觉得还不错? 一键收藏
  • 12
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值