1 intro
- 提出了快速地图匹配(FMM),一种将HMM与预计算相结合的算法
- 在第一个预计算阶段,从路网中创建了一个有上界的OD表,以存储一些对的信息
- 在第二阶段,进行路网匹配计算,其中原先Map Matching中计算成本高的路由查询被替换为哈希表搜索
- 本质上还是一个HMM变体
2 Preliminary
- 道路网络G=(V,E)
- 每一条道路e被存储成:
-
- 边id
- 起点和终点
- 边e的geometry geom
- 长度为L
-
- 每一条道路e被存储成:
- GPS 点
- p=(lat,long,ts)
- ts表示特定时刻
- p=(lat,long,ts)
- GPS轨迹
- tr=<p1,p2,...pN>
3 FMM算法(快速地图匹配)
UBODT里面存储了一部分预计算的边的信息(后面会说)
3.1 预计算阶段
- 在预计算阶段,计算长度低于阈值Δ的G中的所有最短路径对(SP shortest path)
- 以压缩方式存储在上界起点-终点表(UBODT,Upper Bounded Origin Destination Table)中
- UBODT中的每一行对应于从源节点到目的节点的SP,表示为
-
- 分别表示no之后访问的下一个节点和下一条边
- nd之前访问的上一个节点
- dist no到nd的最短路径距离,后文也有用表示的
-
- 构造后的UBODT存储为一个哈希表
- 复合键为
3.2 地图匹配
3.2.1 候选搜索
- p在边e上的候选点——e.geom上p的投影点 (pn的第i个candidate称为)
- dist——p到的距离
- λ——沿着和e.geom从e.s到的偏移距离(0<λ<e.L)
3.2.2 寻找最佳路径
计算Pn的候选点Cn到的候选点的SP距离可能有多种情况(Cn,在的路径方向一致/不一致)
- 转移概率的一个常用定义是两个观测点欧几里德距离除以两个候选点之间的路径距离
- 但在GPS数据密集和搜索半径较大的情况下可能会出现问题
- ——>两个观测点欧几里德距离 比 两个候选点之间的路径距离 还要长
——>论文修改了HMM的转移概率
输出距离和一般的基于HMM 的map matching 一样
假设GPS点在车辆真实位置周围遵循零平均高斯分布
同样根据维特比算法可以找到最优路径
3.2.3 完整路径构造
在前面3.2.2 中 绿色部分的长度我们是从 上界起点-终点表(UBODT)中取出来的
- 现在要把Cn和中间的这一部分路径还原
- 在UBODT中递归第找Cn为起点为终点,为起点为终点的路径,直到到达
- —>最终的路径为:
-
- 这里只列举了Cn和中间的这一部分,所有这种部分的路径都需要还原
-
3.2.4 远程路由查询的处理
- 在计算转移概率的时候,需要查询UBODT以获取SP距离
- 但是连续两个候选点Cn之间的SP距离可能大于Δ,也就不会存在UBODT中
- 此时UBODT不会返回任何相应的SP信息
- 为了解决该问题并评估通过预计算获得的改进,论文设计了四种模式
(M1) UBODT+Dijkstra (brute force) |
|
(M2) UBODT+Dijkstra (optimized) | 如果在UBODT中找不到Δ,则第二种模式首先返回Δ作为SP距离的估计值 |
(M3) UBODT | 这种模式和觉得和模式2没有什么区别? |
(M4) Dijkstra | 在不查询UBODT的情况下,最后一种模式始终调用Dijkstra算法 |
3.2.5 反向移动惩罚
- 当使用HMM模型匹配真实世界的GPS数据时 ,结果中经常观察到车辆在对应于单个双向路段的两条定向边上来回移动,这称为反向移动
- 虽然可能会发生车辆在路段上实际来回移动的情况,但更常见的情况是存在双向路段且GPS观测误差较大
- ——>需要对其加以限制
4 实验
4.1 数据
- 使用的出租车GPS数据最初是在Mobile Millennium项目中收集的。
- 该数据集涵盖了从2013年3月1日到2013年3月31日的一个月
从原始GPS数据中,出租车行程被提取为具有真实租用状态的连续记录序列,并存储为多段线。共提取了673849条轨迹,并根据以下准则对其进行预处理以去除异常值:
(1)轨迹仅包含一个点;
(2) 它的平均速度在150公里/小时以上
(3) 其几何图形超出了道路网络的边界。
最后保留644695次行程(95.7%),包含6812720点。根据经验GPS误差设置为100米。
4.2 Δ值和UBODT
4.3 路径匹配结果
4.4 反向移动惩罚