文章目录
摘要
地图匹配是将观察到的用户位置序列与数字地图上的道路网络对齐的过程,大多数当前的地图匹配算法仅处理高采样率(10-30秒一个点)的GPS数据,但是实际上存在大量的低采样率的GPS轨迹。本文主要针对低采样率的GPS轨迹提出一种新颖的全局地图匹配算法,称为ST-Matching,其考虑两方面:(1)道路网络的空间几何和拓扑结构,(2)轨迹的速度/时间约束。基于时空分析,构建候选图,从中确定最佳匹配路径。并与增量算法和基于平均弗里切特(AFD)的全局地图匹配算法进行比较,实验在真实数据集和合成数据集上进行。提高了匹配精度,准确性,运行时间。
关键词
地图匹配,GPS,轨迹,路网
一、介绍
通常,GPS数据由一系列包含经度、纬度和时间戳信息的点组成,但是,由于GPS设备的限制导致的测量误差以及采样率导致的采样误差,所以该数据并不准确。本文特别解决了采样误差的问题。现有地图匹配算法大多是局部或者增量算法,仅考虑当前位置,忽略临近点的相关性,精度较低,增量匹配是将轨迹的一小部分局部匹配,对采样频率的降低很敏感。全局匹配算法基于特定的距离/相似度度量,缺乏地面真实性,难以评估真实的匹配质量,且仅采用空间分析。
提出两个关键观察结果:1、真实路径往往是直的,不是拐角 roundabout,可以将路网拓扑关系与之前之后的位置信息联合起来。2、真真实的路径遵循道路的速度限制,如图2所示,如果没有速度信息,几乎无法分辨这两个点是在高速路段还是服务路段。
二、相关工作
2.1 地图匹配问题
关于在数字地图上匹配GPS观测值,有许多研究,这些方法通常可以分为三类:局部/增量方法[4][8][20],全局方法[1][3][21],还有统计方法[11][18]。
增量方法尝试找到几何的局部匹配,[8]使用两种相似性度量,一种是距离相似性,另一种是方向相似性,综合的相似性度量是各个部分的总和,时间复杂度O(n);[20]使用Dijkstra algorithm构造最短路径,O(mn log m);[4]提出基于分段的匹配方法,为不同的采样点分配置信度,首先匹配高置信度部分,然后使用之前的匹配边缘匹配低置信度部分。
全局方法旨在使整个轨迹与道路网络相匹配,[21]采用离线捕捉方法,找到最小权重路径,[1][3]基于Fréchet distance 距离或其变体,其考虑了曲线的连续性。
统计模型,[18]提出了一种基于贝叶斯分类器的地图匹配算法,结合了隐马尔可夫模型对道路网络的拓扑约束进行建模。[11]提出基于扩展卡尔曼滤波和三次样条插值的改进方法。
2.2 最短路径计算
在文献[5]中可以有很好的调查,基本算法Dijkstra’s algorithm,[10]中A* algorithm,[12]bidirectional search向搜索,[13]search decomposition搜索分解,[14]hierarchical search 分层搜索。可以添加一些预处理步骤加快最短路径搜索的速度,[6]中使用地标和三角形不等式的组合,有更严格的界限。
三、问题描述
一些定义:
所以现在地图匹配问题可以描述为给GPS轨迹T,道路网G(V,E),从G中找出路径P是所匹配T的真实路径。
四、系统总览
我们提出的地图匹配系统框图如下:
候选准备:包括含有索引边缘和端点信息的道路网络数据库,从用户那里得到原始的GPS轨迹,然后为轨迹上每个采样点检索所有可能的候选点,使用内置的基于网格的空间索引可以更加有效,输出是一组候选点及其所位于的候选路段。
时空分析:空间分析不仅考虑单个GPS点和在该路段的候选点,还考虑道路网络的拓扑关系,为避免 roundabout paths,我们使用最短路径来测量每个候选路径和真实路径之间的相似性。时间分析可用来测量任意相邻点之间的实际平均行进速度。然后将平均速度与每个候选路径上的典型速度约束进行比较。该信息随后可用于在该时间间隔内将轨迹与具有最相似速度条件的候选路径进行匹配。
该部分的输出为一个候选图,图的节点是每个GPS观测点的候选点的集合,图的边缘是任意两个相邻候选点集之间的最短路径的集合。节点和边缘均基于时空分析结果分配了权重。
结果匹配:该部分使用在时空分析中分配的权重信息评估候选图。将给定轨迹与候选图中得分最高的路径匹配,然后将结果显示在可以针对不同最终用户设备的定制界面上。结果也可以存储在流量数据库中以支持外部应用程序。
五、ST匹配算法
5.1 候选准备
给定一条确定轨迹
T
=
p
1
→
p
2
→
p
3
→
⋯
→
p
n
T=p_1\to p_2\to p_3\to\dots\to p_n
T=p1→p2→p3→⋯→pn,对每一个点
p
i
p_i
pi,在半径为
r
r
r的范围内搜索该路段的候选集,然后计算候选点,候选点是
p
i
p_i
pi对这些路段的投影。
在论文中,用
e
i
j
e_i^j
eij和
c
i
j
c_i^j
cij分别表示
p
i
p_i
pi的第
j
j
j个候选路段和候选点。图6中,
p
i
p_i
pi的候选点是
c
i
1
c_i^1
ci1,
c
i
2
c_i^2
ci2,
c
i
3
c_i^3
ci3。
为了便于搜索候选点,使用网格对道路网络进行索引。 一旦为轨迹
T
T
T上的所有采样点检索了候选点集,问题就变成了如何从每个集合中选择一个候选点。
5.2 空间分析
在空间分析中,我们同时使用路网的几何和拓扑信息来评估在上一步中找到的候选点。使用观测概率合并几何信息,并使用传输概率表达拓扑信息。
所谓观测概率,就是基于两个点的距离,得到的相匹配似然性。
一般来说,GPS测量误差可以被描述为
p
i
p_i
pi和
c
i
j
c_i^j
cij之间距离的正态分布
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)。它描述的是在不考虑临近点的情况下,一个GPS采样点
p
i
p_i
pi能够匹配到真实路径上的候选点
c
i
j
c_i^j
cij的可能性。
根据经验评估,我们使用零均值正态分布,标准偏差为20米。
观测概率不考虑前后GPS定位点,所以容易出现误匹配,如图7示例。粗实线代表高速公路,细的垂线代表本地道路。虽然采样点
p
i
p_i
pi距离第一个候选点比较近,但是如果我们知道前一个采样点和后一个采样点在高速路上,那就应该匹配到第2个采样点,这与之前分析的第一个观测结果一致。
计算相邻两个候选点的最短路径作为传递概率:
传递概率分子是两个GPS观测点之间的欧氏距离,分母是前后两个候选点之间最短路径的长度。
空间分析方程结合了观测概率和传递概率,因此几何信息和拓扑信息都有。考虑到实际并不总是遵循最短路径,因此
N
(
c
i
s
)
N(c_i^s)
N(cis)不能省。
经过空间分析,对于任意两个相邻的GPS候选点,可以得到候选路径,每个候选路径分配了一个空间测量值。
5.3 时间分析
仅通过空间分析大多数情况下可以区分出真实路径,但是也有些情况无法处理。通过计算平均速度辅助解决。
平均速度分子是
k
k
k条候选路段集的长度之和,分母是时间间隔。每个候选路段也有其速度,采用余弦距离来测量前后两个候选点真实平均速度和该路径速度限制之间的相似性。(就是高速路速度快,辅路速度慢)。
5.4 结果匹配
经过空间分析和时间分析,可以得到路径的候选图,
V
T
′
V_T^\prime
VT′表示每个GPS采样点的候选点集,
E
T
′
E_T^\prime
ET′表示两个候选点之间最短路径的edges集,如图9,每个点与
N
(
c
i
s
)
N(c_i^s)
N(cis)有关,每条边缘与V和时间有关。
最终为真实路径T匹配的最优路径P描述如下
算法1是ST-Matching算法的伪代码,首先计算每个GPS采样点的候选点,然后根据空间时间分析计算候选图,最终得到具有ST-function最高分数的路径P。FindMatchedSequence主要是为了找到
G
T
′
G_T^\prime
GT′中最长的路径。在图中寻找最长路径是NPC问题。然而
G
T
′
G_T^\prime
GT′是一个有向无环图,其结果可以利用图的拓扑顺序有效的计算出来。算法2是FindMatchedSequence的详细表达。
一个例子:
5.5 本地ST匹配策略
所提出的ST-Matching是全局算法,但是实际中不可能都给出完整路径。所以构建局部候选图,使用轨迹上的滑动窗。局部候选图是轨迹T的一个子集,像在全局算法中一样的计算,然后移动滑动窗口。
将轨迹划分为窗口可以减少平均延迟并节省用于在线处理的存储空间,但不一定会加快整体处理时间,因为ST匹配算法最昂贵的部分是最短的路径计算。为了降低计算复杂度,我们可以试探性地保留到目前为止得分最高的
l
l
l 候选点,从而减少下一个采样点需要计算的最短路径的数量。 当
l
l
l = 1时,ST匹配退化为增量算法。
六、算法分析
分析算法复杂度,
n
n
n是轨迹上GPS采样点的数目,
m
m
m是路网中路段数,假设一个采样点的最大候选点数目是
k
k
k。
文献7采用了Fréchet Distance!
A* algorithm文献10,该算法使用对到目标的距离的估计来指导从源进行搜索的顶点选择。
ALT algorithm 文献6,结合使用地标和三角形不等式来获得更严格的下限,但是它需要更多的磁盘空间来进行预处理。
七、实验
对比全局匹配方法:增量算法和Average-Fréchet-Distance(AFD),运行时间和匹配精度。
7.1 实验设置
路网数据,合成轨迹数据:仿真器,真实轨迹数据。
参数选择:采样率,合成轨迹2分钟到近六分钟,真实轨迹30s到5分钟;
k
k
k=5,
r
r
r=100m,观测概率估计,正态分布,
μ
=
0
,
δ
=
20
m
\mu=0,\delta=20m
μ=0,δ=20m;滑动窗1-40。贝叶斯算法:由文献3,
μ
d
=
10
,
a
=
0.17
,
n
d
=
1.4
,
μ
α
=
10
,
n
α
=
4
\mu_d=10,a=0.17,n_d=1.4,\mu_\alpha=10,n_\alpha=4
μd=10,a=0.17,nd=1.4,μα=10,nα=4,基于AFD算法,
λ
=
10
\lambda=10
λ=10。
7.2 评估方法
运行时间和匹配精度。
7.3 实验结果
分两种情况讨论:合成轨迹和真实路径,探寻不同因素的影响,对比不同算法的效果。
1、合成轨迹
Impact of Max. Number of Candidate Points:候选点为5,运行时间和精度较好;
ST-Matching vs. S-Matching
ST-Matching v.s. Incremental v.s. AFD-based global algorithm
2、真实轨迹
ST-Matching v.s. Incremental v.s. AFD-based global algorithm
Running Time
Localizing Strategies
八、结论
本文提出了一种新的全局地图匹配算法,称为ST-Matching,用于将低采样率的GPS数据匹配到数字地图上。 该算法采用时空分析来生成候选图,从中可以将得分最高的匹配结果序列标识为匹配结果。 实验结果表明,在低采样轨迹的匹配精度方面,我们的ST匹配算法明显优于增量算法。 同时,与基于ADF的全局算法相比,ST匹配还提高了准确性和运行时间。
参考文献
[1] Alt, H., Efrat, A., Rote, G., and Wenk, C. 2003. Matching planar maps. In Journal of Algorithms 49, 2, 262-283, 2003.
[2] Bing maps search (formerly Live maps search). http://cn.bing.com/ditu/. Microsoft Corporation.
[3] Brakatsoulas, S., Pfoser, D., Salas, R., and Wenk, C. 2005. On map-matching vehicle tracking data. In Proceedings of the 31st international Conference on Very Large Data Bases, 853-864, 2005.
[4] Chawathe, S.S. Segment-based Map Matching. In IEEE Symposium on Intelligent Vehicles, 2007.
[5] Fu, L., Sun, D., and Rilett, L. R. Heuristic shortest path algorithms for transportation applications: state of the art. In Comput. Oper. Res. 33, 11, 3324-3343, 2006.
[6] Goldberg, A. V. and Harrelson, C. 2005. Computing the shortest path: A* search meets graph theory. In Proceedings
of the Sixteenth Annual ACM-SIAM Symposium on Discrete, 156-165, 2005.
[7] Gonzalez, H., Han, J., Li, X., Myslinska, M., and Sondag, J. P. 2007. Adaptive fastest path computation on a road network: a traffic mining approach. In Proceedings of the 33rd international Conference on Very Large Data Bases 794-805, 2007.
[8] Greenfeld, J. Matching GPS observations to locations on a digital map. In Proceedings of 81th Annual Meeting of the Transportation Research Board, 2002.
[9] Gutman, R. Reach-based routing: a new approach to shortest path algorithms optimized for road networks. In Proceedings of 6th ALENEX, 100–111, 2004.
[10] Hart, N. Nilsson, and B. Raphael. A formal basis for the heuristic determination of minimum cost paths. In IEEE Transactions on system science and cybernetics, 4:100-107, 1968.
[11] Hummel, B., and Tischler, K. GPS-only map matching: exploiting vehicle position history, driving restriction information and road network topology in a statistical framework. In Proceedings of the GIS Research UK Conference, 68–77, 2005.
[12] JAT, Nicholson. Finding the shortest route between two points in a network. In Computer Journal, 9, 275-80, 1996.
[13] J.F., Dillenburg, P.C., Nelson. Improving search efficiency using possible subgoals. In Mathematical and Computer Modeling, 22(2-7):379-414, 1995.
[14] Jing, N., Huang, Y., and Rundensteiner, E. A. Hierarchical optimization of optimal path finding for transportation applications. In Proceedings of the Fifth international Conference on information and Knowledge Management , 261-268, 1996.
[15] Kuehne, R. et al. New approaches for traffic management in metropolitan areas. In 10th IFAC Symposium on Control in Transportation Systems, 2003.
[16] Li, X., Han, J., Lee, J., and Gonzalez, H. Traffic densitybased discovery of hot routes in road networks. In 10th International Symposium on Spatial and Temporal Databases, 2007.
[17] Pfoser, D. and Jensen, C. S. Capturing the uncertainty of moving-object representations. In Proceedings of the 6th international Symposium on Advances in Spatial Databases, 111-132, 1999.
[18] Pink, O. Hummel, B. A statistical approach to map matching using road network geometry, topology and vehicular motion constraints. In the 11th International IEEE Conference on Intelligent Transportation Systems, 2008.
[19] Samet, H., Sankaranarayanan, J., and Alborzi, H. Scalable network distance browsing in spatial databases. In Proceedings of the 2008 ACM SIGMOD international Conference on Management of Data, 43-54, 2008.
[20] Wenk, C., Salas, R., and Pfoser, D. 2006. Addressing the need for map-matching speed: localizing global curvematching algorithms. In Proceedings of the 18th international Conference on Scientific and Statistical Database Management, 2006.
[21] Yin, H. and Wolfson, O. A Weight-based map matching method in moving objects databases. In Proceedings of the 16th international Conference on Scientific and Statistical Database Management, 437, 2004.
[22] Zheng, Y., Chen, Y., Xie, X., and Ma, W. GeoLife2.0: a location-based social networking service. In proceedings of International Conference on Mobile Data Management, 2009.
[23] Zheng, Y., Wang, L., Xie, X., and Ma, W. GeoLifemanaging and understanding your past life over maps. In 9th International Conference on Mobile Data Management, 2008.