基于python的车辆轨迹研究_基于车牌信息的车辆出行信息分析系统设计——以桂林市为例...

1. 设计背景与目的

交通调查的主要内容包括出行起讫点调查(OD调查)、交通量与交通设施调查、道路通行能力调查等,而进行交通调查需要耗费大量的人力物力,调查过程中各种不确定因素将直接影响调查结果的可信度,所得到的数据也不具有多样性和扩展复用性,这些都促使了现代科学技术与交通调查方法的不断融合与进步。

在交通信息化管理技术日益发展成熟的今天,车牌识别技术也逐步完善与成熟。城市道路网络中,各交通视频监控测点通过车牌识别技术,可将车辆通过测定地点的时间、地点等信息存入交通信息管理中心的数据库中,从而进一步进行数据的挖掘与分析应用。在基于车牌数据进行车流特性分析的研究工作中,以下几项较为具有代表性:

郭昕 [1] 等人基于车牌识别数据,以上海市快速路非沪车牌识别数据为例对车辆使用特征进行了多维研究,从时间、空间、车辆属性等多个方面,对车牌识别技术所得到的车辆出行时间与空间信息进行了深度挖掘与分析,采用新的分析技术来对决策者与管理层进行信息反馈,对城市交通出行特性分析来说具有重要的参考意义。马金麟 [2] 等人通过测点卡口获取得到的车牌信息数据,利用VBA编程实现对车牌数据的分析与挖掘,获取并计算出到各个卡口间的车辆行程时间,并在所得行程时间的基础上,利用递归算法完成对卡口的聚类划分,以进行交通小区的自动划分,加以人工经验修改,最终得到交通小区间的车辆OD分布矩阵。胡旭峰 [3] 针对现在较多应用的交通信息采集技术以及车牌识别技术所获得的信息数据特点,分析并给出了可能出现的数据错误或缺失处理方法,提出且验证了运用车牌识别数据来进行城市道路交通运行状态判断分析的方法,并对行程时间的分布特性进行了研究和指标可靠性分析。

本系统基于数据库中的大量车牌信息数据,通过对其进行清洗、分类、集成、解析,得到城市机动车的出行路径、OD分布、测点间的通行时间分布等特性,并以图表、分布图等形式进行可视化呈现,提高交通调查数据的获取与车辆出行特性的分析效率,为交通的管理与设计提供直观、有效且合理的参考。

2. 设计方法与技术

全桂林市各测点每天收集并传回桂林市智能交通管控中心的车辆信息数据多达150余万条,如此庞大的数据量,只有结合数据库进行查询与分析,才能保证数据分析与处理的效率,保证结果与期望的符合度,也是更为便捷和高效的方法。

与传统的数据分析系统不同,本系统采用Python和SQL编写程序对数据库进行连接,在指定数据表中对数据进行整合分析,在保护数据的同时最大限度的保证了数据的时效性,减小了数据源与数据分析的时间差和滞后性,且运行结果将以新数据表的形式另存在数据库中,为进行各方面、多层次的后续数据挖掘提供了保障。首先对原始数据进行清洗与整合,剔除掉未能成功识别或数据严重不完整的车辆信息,以使后续分析的可靠性和准确性得到保证。其后,通过对数据表的结构进行优化,建立外键缩小数据表体积,提高数据表之间的相关性和程序的运行效率。在上述工作进行完成之后,系统便可以对数据库中的数据进行操作,实现车辆路径的查询、测点OD分布、OD矩阵获取,以及相邻测点间车辆通行时间分布曲线图的生成,系统设计框架构成如图1所示。

4-2760443x10_hanspub.png

Figure 1. Framework of system design

图1. 系统设计框架构成

车牌信息的清洗与整合依照模糊匹配中的编辑距离算法,利用Python、SQL和正则表达式完成。数据表结构的优化通过SQL进行多表更新和表内连接实现。车辆路径的可视化通过调用高德地图API接口完成。测点间OD分布的动态呈现以及相邻测点建车辆通行时间分布曲线的绘制则通过Python的numpy扩展库和pyecharts类库完成。

3. 数据清洗与整合

由于受到光照、车牌磨损、表面污渍等因素的影响,车牌识别技术的读取结果中往往存在部分无效数据,而这些没有能够正确识取的车牌信息散落在存有大量车辆信息的数据库中,将会对系统的运行效率以及数据分析结果的可信度造成不可忽视的影响。若要保证系统运行结果的有效性&#x

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值