移动模型位置预测


文章来自:李雯. 动态关系下的移动对象位置预测方法研究[D].


1.研究现状

  移动对象未来位置预测,主要以移动对象的历史行为数据,即轨迹数据作为研究对象,通过挖掘个体和群体运动中潜在的时空规律性以及移动对象运动中的交互情况来认识个体行为偏好,从而达到准确预测目的。在移动对象位置预测领域,大量的方法和策略被提出。根据位置预测时是否利用移动对象长期历史运动 模式,位置预测方法可以被分为基于运动函数的位置预测方法以及基于运动模型 的位置预测方法。

  基于运动函数的位置预测方法主要考虑移动对象的近期运动情况(例如速 度、方向等),通过模拟移动对象的运动行为,与线性或者非线性的运动函数拟 合,对未来位置进行预测 [28-30] 。然而,现实生活中,对象运动远比运动函数所描 述的更加复杂。由于运动函数利用近期的运动数据,仅能对距离现在较近时间的 位置进行预测,且无法解决突发事件对预测的影响。

  由于基于运动函数的位置预测方法存在很多缺点,且移动对象日常活动并非 随机的,在一定程度上体现出时空规律性。充分学习移动对象历史轨迹数据,能 够在对象处于相似情形时进行预测,于是,大量研究者们开始使用基于数据挖掘 的方法来学习移动对象的历史运动规律 [20, 39-44] 。例如,从移动对象历史轨迹数据 中提取关联规则 [45] 、频繁模式 [46] 、建立贝叶斯网络 [47-49] 、马尔可夫 [50-57] 或隐马 尔可夫模型 [58-62] 、神经网络模型 [63-65] 等。
根据位置预测时使用的数据源是否来自单一移动对象,位置预测方法被分为 个性化的位置预测方法以及一般化的位置预测方法。个性化位置预测方法认为每 个人的运动都是相互独立的,因此仅以移动对象个人历史轨迹为输入,而一般化 位置预测方法认为不同移动对象间存在一定的相似性,且不同对象间的运动会相 互影响,因此其使用所有对象的运动数据或者与被预测对象具有相似运动模式、 行为偏好的其他用户数据 [66] 进行协同预测。

  个性化位置预测时仅利用单个用户的轨迹数据进行分析,不适用于其他用 户。另外,对于个人运动数据较少的用户或者新用户,可能会遇到数据稀疏问题。 因此,需要通过挖掘群体用户的轨迹数据来进行协同位置预测。一般化的位置预 测方法在利用其他用户轨迹数据训练预测模型时,由于日常行为习惯、运动偏好 间的不同,如果只使用运动重叠信息进行预测往往不能达到很好的效果 [67, 68] 。所 以为了提高预测精度,一般化的预测方法中经常需要针对移动对象运动中存在的 相似性进行度量,选择相似度更高的移动对象轨迹数据。

  由于移动对象的多样性以及运动的复杂性,不同移动对象具有不同的运动习 惯,相同移动对象在运动过程中,也可能包含多种运动模式,并且在与朋友进行 交互时,很可能受到其朋友活动的影响。因此,单一预测假设无法完整得描述移 动对象所有的日常行为。虽然大量的移动对象位置预测方法被提出,却无法找到 唯一的最优算法来取代其他算法,需要根据具体的数据类型、应用情况、甚至不 同时间的实时信息,选择不同的预测模型。例如, Jeung 等 [69] 提出根据预测的时期运动进行预测,而对较远时间的位置进行预测时,使用轨迹模式进行预测。 Vincent 等 [70] 使用多种策略来融合动态贝叶斯模型( DBN )、人工神经网络( ANN ) 以及梯度提升决策树( GDBT )的预测结果来达到更优的预测效果。

  在总结移动对象轨迹数据特征及现有的移动对象位置预测理论、方法、相关 技术的基础上,本文发现虽然在部分应用场景下,现有方法能够在一定程度上解 决位置预测问题,但是仍然存在几点挑战及问题:

  ( 1 )全面分析和建模。轨迹数据是移动对象在地理范围内活动时产生的历 史记录,是研究对象运动特征的基本数据。轨迹数据由若干包含时间和空间信息 的采样点序列组成,当前针对移动对象位置进行预测时,一般以预测移动对象未 来访问的兴趣区域(例如家、超市等具有语义含义的位置,而非具体的经纬度点) 为目标,过分关注兴趣区域(高层)活动行为,而忽略了轨迹数据中的低层采样 点序列形成的路径信息对未来位置的影响,因此,无法更全面的对移动对象运动 进行分析和建模。

  ( 2 )稀疏性问题。由于移动对象在日常生活中,一般仅访问少量位置,且 可能访问以往未访问过的新位置,因此无法捕获用户对所有潜在兴趣区域的偏好 程度,在一定程度上带来稀疏问题。此时需要借助额外的数据来帮助对用户行为 的分析,由于移动对象并非孤立的个体,日常活动中存在一定的社会交往且可能 接受别人的推荐,因此,需要研究更合理的方法来建立用户与社交朋友间的交互 运动模式。

  ( 3 )预测模型的多样性。现有的研究以特定领域内的全部用户作为研究对 象,并为其建立统一的运动模型,基于不同的个人数据训练不同的参数。然而, 不同对象具有多样的运动方式和行为习惯,结合个人运动的特殊性有针对性的建 模能够更好地理解移动对象运动模式,因此,在对移动对象轨迹进行分析时,需 要考虑不同模型对于个体运动的适应性。


2.轨迹数据概述及移动对象位置预测相关技术

2.1 移动对象轨迹数据概述

  移动对象轨迹可以看作是移动对象随时间在空间范围内运动所产生的记录, 采样点主要包含地理位置信息、时间信息,还可能含有移动个体的运动特征信息 (例如速度、加速度等),将这些信息按照时间顺序连接起来就是轨迹数据。

2.1.1 轨迹数据的获取

  当前, GPS 设备、传感器网络、无线通信等技术以及基于位置的社交网络快 速发展,使得移动对象的物理位置能够很容易被收集到,移动对象轨迹数据能够 通过直接获取和隐式推理两种方式获得。

  ( 1 )直接获取。直接获取是指移动设备记录位置的方式为准确的经纬度数 值或者语义位置点,能够直接用于后续的分析和挖掘。例如,户外运动爱好者使 用带有 GPS 装置的移动设备记录运动路线,以一定的时间和地理距离间隔记录移 动对象具体的经纬度。众多用户在餐厅、商场、旅游景点等的签到(经纬度、地 点 ID 、签到时间)序列可以看作人们的移动轨迹。大量交通工具(例如私家车、出 租车、公交车、船、飞机等)使用定位设备采集移动对象在空间内的轨迹数据 [71] 。通 过为老虎、鸟类等动物携带定位设备可以研究动物的迁徙规律,行为和生存状况 [72] 。智能手机能够定位当前设备所处的基站位置,从而反映手机终端持有者的移 动轨迹数据。基于卫星遥感监测、天气雷达监测以及地面自动气象站监测等技术 可以获取的飓风、台风等自然现象的轨迹数据。

  ( 2 )隐式推理。隐式推理表示不能从原始记录的数据中直接读取固定的位 置值,需要通过一定的推理来获得其中隐含的位置信息。例如,用户在基于位置 的社交网络中以文字的形式记录行程,并涉及语义位置信息。在 Flickr 中,一系 列地理标记的照片能够形成一个空间轨迹,因为每张照片都有拍摄该照片的相应 地点标注和时间戳。视频监控系统对移动对象(人类、动物等)进行实时监控, 并从视频中不同帧提取所对应的地理位置,从而获得其运动轨迹。

2.1.2 轨迹数据的分类

  不同应用场景下,不同的移动设备被用来记录移动对象的轨迹,使得空间轨 迹数据在特征属性、采样频率、轨迹长度、运动规律等方面都有很大的不同,最 常用的数据类型包括:

  ( 1 ) GPS 数据。 GPS 设备由于其小巧、便宜等特点,能够被嵌入至车载装 置或手持终端,从而很容易得获得轨迹数据;然而, GPS 设备在室内或室外有遮 挡的地方无法正常工作,存在一定程度的数据缺失,并且 GPS 数据为高频连续 采样数据,需要额外的处理将原始的采样点序列转化为语义位置序列。

  ( 2 )移动手机数据。随着智能设备的普遍使用,移动手机数据能够很容易 的被获取;然而,移动手机只在用户打电话、发短信或使用网络服务时记录距离 用户最近的信号塔位置。由于每个塔的覆盖范围由城市密集区域的几百米到郊区 的几千米范围不等,无法分辨出移动对象在小范围内的运动,常常将距离较远的 位置标记为相同位置,严重的限制了在细粒度水平分析对象运动模式的能力。

  ( 3 )基于位置的社交网络数据。当用户登录基于位置的社交网络( LBSNs , 例如 Foursquare, Gowalla, Facebook Places etc. )时,通过在线 check-in 行为来记 录用户当前所在位置。签到数据只在用户进行标记时被收集,具有数据稀疏性, 而用户很可能只在其感兴趣的位置进行签到,可能造成日常最常访问位置数据的 缺失。另外, LBSNs 数据集中还记录了用户社交圈内的朋友关系数据,可以研 究社交关系对用户移动行为的影响。

  ( 4 )无线网络定位。 Wifi 、 Zig Bee 等技术具有较高的定位精度,但需要在 环境中部署大量的无线节点,需要较多的前期投入,通常用于室内定位。

  ( 5 )混合数据。此类数据集包含多种来源的数据和额外数据,例如 GPS 、 加速度器、 GSM 、蓝牙、 WLAN 以及蜂窝网络等。在某种类型数据出现缺失时, 可以使用其他类型数据进行补偿。当多种定位技术和定位设备能够同时监测到一 个移动目标时,可以同时得到多个定位数据,通过采用合适的融合算法,可以提 高定位精度。然而,由于定位误差的存在,如何解决数据特征的不匹配以及数据 冲突是进行数据融合的关键。

2.1.3 轨迹的相关概念

  轨迹是移动对象运动中在时空维度内留下的记录,虽然不同的定位设备、应 用场景下产生的信息量和信息维度有很大不同,例如,车载 GPS 设备产生的采 样点可能包含经纬度、时间标签、速度、加速度,而在基于位置的社交网络中, 除了用户签到时产生的时空信息,还可能包含用户间的朋友关系,每次签到时的 短文本信息。基本上移动对象的采样点都包含经纬度以及时间信息,本文以最基 础的特征为例,给出轨迹数据挖掘中涉及到的一系列定义的形式化表示。

   定义 2-1 :轨迹点是移动对象运动过程中每次采样时被记录的信息,通常包 含当前位置以及采样时间。采样点 p 可以表示为一个三元组
p = ( x , y , t ) p=(x,y,t) p=(x,y,t)
其中 x x x表示经度, y y y表示纬度, t t t为采样时间。轨迹点是移动对象轨迹中最基本的数据单元,由时间和空间信息组成。

定义 2-2:移动对象的轨迹 T r a Tra Tra 由一系列按照时间排序的轨迹点组成。
T r a = ( p 1 , p 2 , … , p n ) ( p i = ( x i , y i , t i ) ) Tra=(p 1 ,p 2 ,…, p n )(p i =(x i ,y i ,t i )) Tra=(p1,p2,,pn)(pi=(xi,yi,ti))
其中 p i pi pi为移动对象在第 i 次采样时的轨迹点, n n n为轨迹中包含的轨迹点的数 量,即轨迹的长度。连续的轨迹点也常被称为轨迹段,例如 ( p i , … , p j ) (p i ,…, p j ) (pi,,pj)。移动对象 轨迹描述了用户在运动过程中产生的地理信息,是研究移动对象运动行为时最常 见的数据结构。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值