概要
数字地图使用的道路参数通常来源于地图提供商。由于某些原因,地图提供商提供的数据信息与实际道路的位置信息可能存在偏差。另一方面,在某些特定的地理条件下(高山、峡谷等),gps定位系统给出的位置信息(统计平均)与实际也可能产生偏差。这两种情况均可能给MM(道路匹配)算法带来挑战。本文提出了一种纠偏的思路,它基于离线数据挖掘,将全局轨迹匹配的道路与线上服务实时匹配的道路进行比较,挖掘出哪些道路存在位置偏差(或gps偏差),将其补齐后在线上服务中应用,以提升线上匹配的准确性。
思路
MM按照匹配的实时性可以分为全局匹配和实时匹配,全局匹配的效果无疑是最优的,但实时匹配的互动性更加。在车载导航等场景需要用到实时匹配。本文的思路就是通过离线的全局匹配,来辅助线上实时匹配的准确性。
步骤
- 记录一条轨迹的原始点和实时匹配的道路(link1s);
- 通过全局匹配的方案给出该条轨迹最优的匹配道路(link2s);
- 对同一个轨迹点,若其匹配的link1!=link2,则记录下该路段与定位的位置偏差offset;
- 对一段时间内所有轨迹点进行统计挖掘,重复上面的1-3步骤;
- 对第4步给出的结果对同一道路上进行加权平均,给出average offset;
- 根据一定的阈值条件,满足条件的打印结果;
细节
- 考虑到道路条件随时都可能发生变化,因此该数据挖掘任务需要定期运行更新(数据更新);
- 当定位装置给出了精度本身不够高时(如低速行驶、wifi定位等),这部分点需要进行过滤不做处理(抛弃本身不合理的点);
- 只对道路出现次数高于一定阈值,同时gps给出的位置信息与真实道路的位置偏差超过一定阈值的情况进行纠偏(防止过度纠偏);
- 如果道路的长度较长,给出一个单一的offset显然也是不合理的,此时可以考虑将道路进行分段,然后给出分段的offset(细化);
- 只对绑路错误道路出现次数超过阈值的进行统计(防止过度纠偏);