0、论文基本介绍以及相关内容
- 分析移动用户位置的相似性,提取移动用户的相似路径在出行路径预测、兴趣区域发现、轨迹聚类、个性化路径推荐等领域具有广泛的应用。
- 重点:利用移动用户定位数据找到合适轨迹的表示方法,如何高效计算移动用户轨迹间的相似性成为热点。
本文---基于改进LCSS的移动用户轨迹相似性查询算法研究:
(1)移动用户原始轨迹数据->抽取位置序列->映射为具有时间和地理位置信息的序列。
解决移动用户轨迹数据的稀疏性导致相似度算法效率低下的问题。
(2)FP-tree频繁模式树的加权频繁模式挖掘移动用户轨迹的频繁序列。
解决由于用户轨迹随机性和繁杂性而导致的算法效率低下的问题。
(3)通过改进LCSS算法
结合时间和地理因素衡量用户轨迹的相似性。
- 衡量相似度的方法有很多:欧式距离,动态时间规划DTW,编辑距离EDR,最长公共子序列,最大时间出现法MCT,余弦相似性,Hausdorff距离。其中基于轨迹数据衡量相似度的算法有三种:欧式距离,DTW算法,LCSS算法。
1、欧式距离(关键输入:时间,位置,用户)
欧氏距离是指通过计算每个时间点上轨迹所对应的两个点的欧式距离,然后再对所有点的欧式距离进行综合处理,包括取平均值、求和、取中位数等。
\[dist(p_{k}^{A}, p_{k}^{B}) = \sqrt{(p_{k,x}^{A} - p_{k,x}^{B})^{2} + (p_{k,y}^{A} - p_{k,y}^{B})^{2}}\]
其中\(dist(p_{k}^{A}, p_{k}^{B})\)表示用户A和B在某时间段内的距离,\(p_{k}^{A}, p_{k}^{B}\)表示A和B在k时刻的位置,\(p_{k,x}^{A} - p_{k,x}^{B}\)表示用户A和用户B在x维度的位置,同理,\(p_{k,y}^{A} - p_{k,y}^{B}\)表示用户A和B在y维度上的位置。因此欧式距离为:
\[EU = \sum\limits