时空轨迹数据挖掘综述

时空轨迹数据挖掘综述

得益于空间定位技术、传感器网络的飞速发展,空间定位传感器在飞机、舰船、汽车以及手持设备上得到普遍使用,产生并积累了海量的移动目标时空轨迹数据。这些时空轨迹数据内嵌于连续的空间,数据本身在时间与空间上存在很强的自相关性,其中隐含的模式往往具有局部性的特点,从而使得面向时空轨迹数据的挖掘具有较高的复杂性。过去十几年来业界提出了一些列的技术与方法来分析挖掘海量、高维的时空轨迹数据,萃取轨迹数据中隐含的价值知识,从而催生出众基于轨迹数据、多面向不同业务场景的上层应用,如智能交通系统、智慧城市/城市计算、飓风预测等。

在本文中,对时空轨迹数据的挖掘分析做了系统性的综述,提供了该领域的研究全景图以及各个子课题的研究范围。给出了从数据产生、预处理、数据管理、再到各种挖掘任务的一个技术路线图。本文的最后还介绍了将轨迹数据转化为其他格式的方法,如图、矩阵、张量等,从而使得更多的数据挖掘和机器学习方法可以应用于轨迹数据的分析处理。

概念定义

轨迹数据定义

时空轨迹数据是由地理空间中的运动物体产生的轨迹,通常由一些列具有时间顺序的空间点表示,形式化表述如下:Trajectory tk=p1->p2->……->pn,其中pi表示目标在ti时空空间位置及其他属性,通常pi的要素包括:定位点ID、轨迹ID、经度、纬度、高度、速度、时间等。轨迹数据集Trajectory Set S={t1, t2, ……, tm},其中ti表示第i条轨迹。现实世界中轨迹数据的来源主要分为如下四个类别:

人员流动:随着智能手机可穿戴定位设备的广泛使用,人们在真实地理空间的流动轨迹或被动、或主动地记录并存储,形成了丰富的时空轨迹数据。这类数据经过分析挖掘后可丰富社交网络内涵,催生众多的应用,如同伴发现、旅游推荐、路径规划等。

交通工具运行:绝大多数汽车、飞机、舰船都配备并启用了GPS定位传感器,它可以以一定的频率主动报告带有时间戳的位置信息,在这些交通工具运行过程中会产生海量的轨迹数据。通过对这些数据的存储分析处理,可实现流量分析、异常检测、路径规划等。

动物流动:通过在动物身上绑定带有定位功能的传感器设备,可以收集老虎、鸟类等动物的迁徙活动轨迹,从而研究动物的生活行为情况以及地区的生态变化情况。

自然现象流动:气象学家、海洋学家、气候学家等通过探空气球、气象卫星等设备收集了飓风、龙卷风、洋流等自然现象的移动轨迹。通过对数据的捕捉处理,可以分析环境和气候的变迁,对自然灾害进行及时的预警预测。

不同来源的轨迹数据分析挖掘关注重点、处理方法不尽相同例,如人的停留点检测与飞机的停留点检测就完全不同,人可以呆在一个地方静止不同,而飞机则需要保持一定的速度飞行才能维持稳定的空中状态。因此需要引入需要根据根据不同的业务场景、引入相应的背景知识,采用合适的算法工具,才能更好的挖掘出时空轨迹数据背后所隐含的知识规律。

轨迹数据挖掘内涵

时空轨迹数据预处理:时空轨迹数据预处理是时空轨迹数据挖掘的基础,包含噪声过滤、轨迹分段、停留点检测、轨迹压缩、地图匹配等内容。其中噪声过滤目的是剔除轨迹中因传感定位设备误差造成的显著偏离正常范围的数据点或者航迹段;轨迹分段是通过时间分段、空间形状、语义含义将轨迹分段,便于后续的聚类分类,例如人的一天出行的轨迹可分段为家到工作地、工作地到商场、商场到地铁站、地铁站到家等几段;停留点/驻留区域检测指找出轨迹段中含有特定语义的轨迹段,如逛商场或吃饭;轨迹压缩主要采用一定的算法在不丢失轨迹原有的特征情况下,压缩数据规模,降低存储处理的难度;地图匹配主要实现轨迹与路网的匹配。

时空轨迹数据管理:旨在对海量时空轨迹数据构建时空索引,满足大量应用从轨迹库中对原始轨迹数据的即席查询分析需求。典型的即席查询需要包括最近邻查询(the nearest neighbors)与范围查询(Range queries)。轨迹间距离度量是最近邻查询的基础,常见的距离度量算法将在后续进行详细讨论。此外历史轨迹数据管理和实时轨迹数据管理采用不同的方法进行处理。

时空轨迹数据分析挖掘:包括时空轨迹数据的不确定性处理轨迹模式挖掘。其中轨迹数据不确定性是指目标在采用时间区间之间的位置不确定性,处理包含两个方面的研究内容,其一,试图通过建模与引入背景知识来减少轨迹的不确定性;其二对时空轨迹数据的隐私保护研究。轨迹模式挖掘主要研究目标对象的移动模式,伴随模式、周期模式、频繁序列模式、关联模式、轨迹聚类。

时空轨迹数据分类与预测:轨迹分类采用有监督学习方法将轨迹划分为某些类别,同时构建分类模型,用于实时轨迹的分类识别。轨迹预测包含两个层次的预测,其一基于当前状态的位置与轨迹预测;其二基于当前密度、事件、历史知识相结合的时间序列预测。预测是轨迹数据挖掘分析的最终应用需求,同时也是当前研究实现难度较大的部分。

时空轨迹数据异常检测:包含两个层次的异常检测。第一层次基于当前运动状态与背景知识的异常检测,如飞机掉高等;其二、通过与样本库中的轨迹模式进行对比分析,当前轨迹的异常值在某些度量方面与其他数据有着显著的不同或者是不符合预期模式的事件或者观察值,如车祸。

时空轨迹数据转移处理:通过一定的数据,可将轨迹数据转换为其他格式数据,如图、矩阵、张量,一方面可以降低数据规模,另一方面,可以借助现有的数据挖掘技术(图挖掘、协同过滤CF、矩阵因式分解MF、张量分析TD)拓展时空轨迹挖掘的方法。

  • 6
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值