1 intro
1.1 传统轨迹管理和挖掘方法
- 包括轨迹计算分析的全过程拆解
- 轨迹预处理
- 轨迹索引和检索
- 轨迹模式挖掘
- 不确定性建模
- 这些过程通常是松散耦合的,为不同阶段开发了众多高效的算法
- 在轨迹预处理中,开发了一系列技术,如地图匹配和停留点检测
- 对于轨迹检索和索引,开发了一系列技术,包括相似性链接、区域查询、语义查询等
1.1.1 传统方法的挑战
- 1) 缺乏统一性。
- 传统轨迹分析和处理问题需要结合问题场景使用不同的工具,使问题建模过程难以统一
- 2) 复杂性。
- 原始轨迹数据通常包含复杂的时空异质性和自相关性
- 通过特征工程和简单的专家手工规则设计难以捕捉其内在特征
- 3) 可适应性
- 传统轨迹技术在处理大规模数据时经常面临维数灾难,通常难以适应新的应用场景
1.2 深度学习方法
- 通过丰富的神经网络架构和学习范式,将传统问题无缝转换为学习任务
- 通过整合来自空间统计、几何和地理等领域的专家先验知识,这些模型能有效捕捉时空轨迹中的复杂模式,促进了各种新颖应用的发展
1.3 和其它方法的对比
- 现有的综述往往专注于有限范围内的特定视角,并没有一项综述全面总结深度学习应用于轨迹数据的演化和进步
2 预备知识
2.1 定义和符号
2.1.1 时空点
- 时空点 p 是一个独特的实体,形式为 (o, t, l, f)
- 移动对象 o 在时间戳 t 下访问位置 l,并带有一个可选属性特征 f。
2.1.2 轨迹
- 由一系列时空点序列 (p1, p2, ..., pn) 按时间顺序排列组成,表示在地理空间中移动对象生成的移动信息
2.1.3 轨迹的多种形式
- 对象属性
- 个体轨迹——代表个体移动的准连续跟踪数据
- 群体轨迹——表示在观察期间一组个体的移动,通常聚合成边/节点、网格或在移动性图中的一组兴趣点(POI)
- 基于采样频率的维度
- 稀疏轨迹(例如,用户旅行期间的签到数据)
- 密集轨迹(例如,装备有 GPS 跟踪系统的车辆的移动路径)
- 位置属性
- 原始轨迹
- 基站轨迹
- 带有属性特征f的语义轨迹
2.2 轨迹数据的独特属性
- 时空依赖性
- 个性化
- 轨迹数据来源于特定的个体或实体,固有地包含了个性化特征
- 这些特征揭示了主体的偏好和移动习惯,准确地建模这些个性化特征非常重要
- 不规则性
- 轨迹的不规则性主要是由于采样设备的限制或数据压缩的必要性
- 模型在训练期间经常缺乏足够的监督信息
- 例如,缺乏两个位置之间的详细路径信息可能导致预测任务的性能恶化
2.3将轨迹转化为其他格式
2.3.1 矩阵
- 对于给定的城市,可以根据纬度和经度将其划分为多个(N1 × N2)网格。每个网格代表城市中的一个独特区域
- 轨迹可以表示为网格标识符的连续序列
2.3.2 图
- 城市的道路网络可以转换成道路的有向图 G = (V, A)
- V 表示网络中的道路
- A 表示道路段之间的连通性
2.3.3 光栅图像
- 由排列在网格中的像素组成
- 每个像素拥有特定的语义和位置信息,以预定的顺序形成整个图像
2.4 DL背景知识
2.4.1 学习组块
2.4.2 学习范式和框架
- 监督学习
- 例如轨迹预测,其中历史轨迹作为输入,旨在预测潜在的未来位置
- 半监督学习
- 在标记轨迹数据有限的情况下,通过允许模型利用额外的未标记数据来提高性能
- 无监督学习
- 旨在发现未标记数据中的模式和结构
- 自监督学习
- 无监督学习的一个子集
- 它广泛应用于轨迹表示学习,随后应用于多种下游任务
- 迁移学习
- 利用从一个任务获得的知识来提高相关任务的性能
- 这在跨城市的知识转移中特别有用,其中城市之间的基本元知识可能不同
- 多任务学习
- 涉及训练模型同时执行多个任务,跨任务共享知识
- 例如,在轨迹恢复任务中,同时处理预测道路段和预测移动比例可提高总体性能
- 深度强化学习
- 训练模型通过与环境的交互做出序列决策。
- 常用于动态环境中涉及轨迹规划和控制的任务,如订单交付
- 深度生成学习
- 包括变分自编码器(VAEs)、生成对抗网络(GANs)和扩散模型
- 旨在学习可观察样本的概率密度并随机生成新样本。
- 通过生成合成轨迹,它有助于解决数据受限场景中的限制
- 联邦学习
- 使模型能够在不交换原始数据的情况下跨分散设备进行训练
- 通过在分布式设备上协作上传和训练模型,它解决了轨迹数据管理和挖掘任务中的用户隐私问题
3 分类
4 轨迹数据管理
4.1 预处理
4.1.1 轨迹简化
- 在传感器噪声存在和高频采样的固有特性下,图5展示了在移动轨迹中出现几乎相同的“冗余点”(例如,p5-p8)和“漂移点”(例如,p9)。
- 为缓解这些问题,轨迹简化方法旨在去除冗余和异常点,有效减少数据量而不显著改变轨迹的整体信息。
- 早期方法
- 通常基于人工制定的规则,可分为批处理模式和在线模式
- 批处理
- 涉及访问完整的历史轨迹数据,旨在平衡压缩率和数据损失
- 著名方法包括DP [207] 和DPTS [208],它们计算每个点的重要性值以捕获压缩错误
- Direction-preserving trajectory simplification,VLDB 2013
- Algorithms for the Reduction of the Number of Points Required to Represent a Digitized Line or its Caricature, Cartographica: the international journal for geographic information and geovisualization 1973
- 在线模式
- 只允许访问缓冲区的传感器数据
- 从动态变化的窗口中提取特征点进行在线压缩
- 批处理
- 此外,语义简化 [211] 作为一种替代方案,利用道路网络促进轨迹简化并减少空间冗余
- “Trace: Real-time compression of streaming trajectories in road network, VLDB 2021
- ——>手动规则的方法缺乏适应性
- 通常基于人工制定的规则,可分为批处理模式和在线模式
- 最近的研究
- 利用深度学习最小化原始和简化轨迹之间的误差,同时限制简化轨迹的长度
- RLTS [59]
- 采用强化学习学习MDP的策略以最小化丢弃点的误差
- Trajectory simplification with reinforcement learning, VLDB 2021
- S3 [60]
- 引入了基于注意力的序列到序列(Seq2Seq)框架
- 采用可微分的重构学习进行轻量级轨迹简化,遵循自监督学习范式
- A Lightweight Framework for Fast Trajectory Simplification,, ICDE 2023
- RLTS [59]
- 通过结合图神经网络编码器来捕捉上下文感知的移动模式并改进轨迹的地理语义表示,提高压缩效率和效果
- MARL4TS [61]
- 扩展了在有界错误条件下最小化简化轨迹长度的目标
- 是一种多代理强化学习方法
- Error-bounded Online Trajectory Simplification with Multi-agent Reinforcement Learning, KDD 2021
- RL4QDTS [62]
- 引入了一种称为查询精确度驱动的轨迹简化方法
- 采用多代理强化学习合作,旨在解决大规模轨迹数据库的挑战,以减少存储成本和加快查询处理。
- Collectively simplifying trajectories in a database: A query accuracy driven approach,ARXIV 2023
- MARL4TS [61]
- 利用深度学习最小化原始和简化轨迹之间的误差,同时限制简化轨迹的长度
4.1.2 轨迹恢复
- 由于记录设备(如通信延迟、GPS定位误差和隐私问题)的问题,收集的数据通常覆盖了大量采样率低或缺失的轨迹
- 以图5为例,原始轨迹缺少在绿色虚线区域内(例如,在信号站缺失区域驾驶)的任何记录信息,这可能阻碍其在下游应用中的利用
- ——>轨迹恢复旨在将这些不规则、低采样率的轨迹转换为高采样率的轨迹,有效支持移动性计算应用
- 传统轨迹恢复
- 将轨迹视为空间序列数据,利用相邻点之间的相关性填充缺失点
- 早期方法,如线性[213]和多项式[214]插值,难以捕捉复杂的依赖性
- 最近的深度模型,根据外部信息,被分类为两种设置
- 自由空间轨迹恢复
DHTR[36] | 将Seq2Seq框架扩展到SubSeq2Seq,引入了一个带卡尔曼滤波器的深度混合模型,用于减少不确定性 Deep trajectory recovery with fine-grained calibration using kalman filter TKDE 2019 |
AttnMove[63] |
Attnmove: History enhanced trajectory recovery via attentional network AAAI 2021 |
PeriodicMove[64] |
Periodicmove: shift-aware human mobility recovery with graph neural network CIKM 2021 |
TrajBERTT[65]和TEIR[66] |
“Trajbert: Bert-based trajectory recovery with spatial-temporal refinement for implicit sparse trajectories ,IEEE Transactions on Mobile Computing, 2023. “Teri: An effective framework for trajectory recovery with irregular time intervals VLDB 2023 |
-
- 在第二种设置中,恢复涉及利用外部知识(如道路网络、POI)
MTrajRec[67] | 在Seq2Seq模型中首创了地图约束轨迹恢复的多任务学习 Mtrajrec: Map-constrained trajectory recovery via seq2seq multitask learning, KDD 2021 |
RNTrajRec[68] |
Rntrajrec: Road network enhanced trajectory recovery with spatial-temporal transformer icde 2023 |
-
- 在实际场景中可以补充大量的语义和视觉信息
STR[70] | 通过利用异构信息网络编码器来模拟语义相关性 Learning semantic behavior for human mobility trajectory recovery,” IEEE TITS, 2024 |
VisionTraj[69] | 采用视觉和GCN编码器模拟道路网络摄像头的快照 “Visiontraj: A noise-robust trajectory recovery framework based on large-scale camera network arxiv 2023 |
Traj2Traj[71] | 引入了一个潜在因子模块以提高恢复效率 Traj2traj: A road network constrained spatiotemporal interpolation model for traffic trajectory restoration,” Transactions in GIS, 2023 |
PATR[72] | 进一步纳入了一个周期感知模块,应用于真实的物流平台 Patr: Periodicity-aware trajectory recovery for express system via seq2seq model,” in GLOBECOM 2022-2022 IEEE Global Communications Conference. IEEE, 2022 |
- 轨迹恢复的另一个重要应用是城市道路网络的恢复
DeepMG[73] | 基于大量轨迹数据发现和提取底层道路网络的结构 “Learning to generate maps from trajectories AAAI 2020 |
DeepDualMapper[217] DF-DRUNet[218] DelvMap[74] |
Delvmap: Completing residential roads in maps based on couriers’ trajectories and satellite imagery,” IEEE Transactions on Geoscience and Remote Sensing, 2024. Deepdualmapper: A gated fusion network for automatic map extraction using aerial images and trajectories AAAI 2020 “Df-drunet: A decoder fusion model for automatic road extraction leveraging remote sensing images and gps trajectory data,” International Journal of Applied Earth Observation and Geoinformation 2024 |
4.1.3 地图匹配
- 将时空点的纬度和经度序列转换为道路段序列
- 原始轨迹序列 {p1, ..., p13} 可以映射到道路段 {r1, ..., r7}
- 早期的方法
- 隐马尔可夫模型(HMM)表现出更好的对噪声和采样率的鲁棒性
- 基于HMM的方法并没有充分利用大量的轨迹数据
DeepMM[75] | 开发了第一个带有注意力机制的深度模型,能够准确地将稀疏和噪声轨迹映射到道路网络上 “Deepmm: Deep learning based map matching with data augmentation,” IEEE Transactions on Mobile Computing, 2022 |
[76] |
Transformer-based mapmatching model with limited labeled data using transfer-learning approach,” Transportation Research Part C,2022 |
L2MM[77] | 建议进行高频轨迹增强和数据分布增强,以提高模型地图匹配任务的泛化能力 “L2mm: learning to map matching with deep models for low-quality gps trajectory data tkdd 2023 |
- 上述方法忽略了地图匹配的图本质
GraphMM[78] | 结合图神经网络来提取轨迹与道路之间的相关性,以及轨迹间和轨迹-道路之间的相关性 Graphmm: Graph-based vehicular map matching by leveraging trajectory and road correlations TKDE 2024 |
DMM[79] TBMM[80] FL-AMM[81] | 将其扩展到包括无线传感器数据在内的地图匹配场景,通过结合联邦学习和强化学习等技术 Dmm: Fast map matching for cellular data,” in Proceedings of the 26th Annual International Conference on Mobile Computing and Networking,2020 Map-matching on wireless traffic sensor data with a sequence-to-sequence model,mdm 2023 “Fl-amm: Federated learning augmented map matching with heterogeneous cellular moving trajectories,” IEEE Journal on Selected Areas in Communications, 2023 |
4.2 存储
4.2.1 存储数据库
- 研究社区已经开发了一系列专门的管理系统[223]-[225]来处理轨迹数据类型,
- 这些数据库支持的查询类型是有限的
- Sharkdb: An in-memory column-oriented trajectory storage,” CIKM 2014
- Elite: an elastic infrastructure for big spatiotemporal trajectories, VLDB 2016
- Dragoon: a hybrid and efficient big trajectory management system for offline and online analytics,” VLDB 2021
- 开源社区扩展了现有的分布式系统
- 通过引入自定义数据格式如LineString和GPX[226],用于大型轨迹存储
- “Gpx the gps exchange format,2004
- 利用深度表示学习的向量数据库作为一种流行的数据库类型[83]已经出现
- 这些数据库为各种数据提供了有效的存储、检索和查询能力
- 目前对轨迹向量数据库的研究较少[84],[85],现有工作主要集中在推进轨迹表示学习上,旨在自动将原始轨迹压缩到低维向量空间中
- “Milvus: A purpose-built vector data management system ICMD 2021
- Vector-based trajectory storage and query for intelligent transport system IEEE TITS,2017
- Ghost: A general framework for high-performance online similarity queries over distributed trajectory streams Proceedings of the ACM on Management of Data,2023
4.2.2 索引和查询
- 轨迹索引是设计用于高效组织和存储轨迹的数据结构,使得能够快速检索和分析
传统的轨迹索引[34],[227],[228] | 主要采用R树以分层方式组织轨迹点或段 通过缩小搜索区域来便于轨迹查询 “Trajectory similarity join in spatial networks vldb2017 Distributed Trajectory Similarity Search,PVLDB 2017 Distributed In-Memory Trajectory Similarity Search and Join on Road Network ICDE 2019 |
TraSS[86] | 提出了一种新颖的空间索引XZ,用于在键值数据库中快速查询轨迹 Trass: Efficient trajectory similarity search based on key-value data stores ICDE2022 |
- 深度学习已广泛应用于改进这些数据索引的查询效率,即学习索引
- ·它学习数据分布和访问模式
现有的空间学习索引[87],[88] | 主要关注低维数据,如二维GPS点 Effectively Learning Spatial Indices VLDB 2020 The Case for Learned Spatial Indexe ARXIV 2020 |
X-FIST[89] | 将学习索引技术扩展到轨迹,它索引轨迹的最小边界矩形(MBRs) 对于每个数据,X-FIST首先创建一个子轨迹列表,然后分别在子轨迹的MBRs的左下和右上顶点上构建两个Flood索引 “X-FIST: Extended Flood Index for Efficient Similarity Search in Massive Trajectory Dataset INFORMATION SCIENCE 2022 |
4.3 分析
4.3.1 轨迹相似度
- 传统方法:采用启发式方法
- 包括基于点的DTW[229]、LCSS[230]、EDR[231]距离和基于形状的Frechet[232]、Hausdorff[233]距离
- 最近的研究引入深度学习来增强测量效果和提高计算效率
- 这些方法可以根据学习范式(自监督学习,即SSL或监督学习,即SL)和不同的度量空间(自由空间或道路网络)设置进行分类
- 自由空间
- 此类方法测量自由空间中原始轨迹的相似性,通常将它们转换为单元格轨迹以进行实际操作
- 基于SSL的方法【基于重构的方法】
- 此类方法测量自由空间中原始轨迹的相似性,通常将它们转换为单元格轨迹以进行实际操作
t2vec[234] | 第一个采用SSL的深度学习模型,通过子采样生成相似轨迹训练对 Deep Representation Learning for Trajectory Similarity Computation ICDE 2018 |
RSTS[90]、Tedj[91]和At2vec[92] | 分别从时间、多粒度和POI相似性等角度增强了t2vec “Towards Robust Trajectory Similarity Computation: Representation-based Spatio-temporal Similarity Quantification WWW 2023 “Similar Trajectory Search with Spatio-temporal Deep Representation Learning,” ACM Transactions on Intelligent Systems and Technology, 2021 “Representation Learning with Multi-level Attention for Activity Trajectory Similarity Computation TKDE 2022 |
CL-Tsim[93] | 引入了一种对比方法,通过创建正负训练样本学习区分性轨迹表示 “Efficient Trajectory Similarity Computation with Contrastive Learning CIKM 2022 |
TrajCL[94]和TrajRCL[95] | 引入了各种轨迹增强和对比学习方法,以共同从空间和结构角度捕获轨迹相似性 ICDE 2023 Contrastive Trajectory Similarity Learning with Dual-Feature Attention “Self-supervised contrastive representation learning for large-scale trajectories,” Future Generation Computer Systems, 2023. |
CSTRM[96] | 采用浅层Transformer编码器,旨在捕捉多尺度相似性 CSTRM: Contrastive Self-Supervised Trajectory Representation Model for Trajectory Similarity Computation,” Computer Communications, 2022 |
TrjSR[97] | 将轨迹转换为图像,旨在捕捉多尺度相似性 On Accurate Computation of Trajectory Similarity via Single Image Superresolution,” in IJCNN, 2021, |
Play2vec[98] | 进一步学习运动轨迹数据集的相似性,并将其应用于体育比赛分析'/ Effective and Efficient Sports Play Retrieval with Deep Representation Learning, KDD 2019 |
-
-
- 基于SL的方法[有效地近似现有的启发式测量]
-
NEUTRAJ[99] | 这一类别的先驱 采用了一个带有空间注意力内存模块的RNN模型来学习空间接近轨迹之间的相关性 “Computing Trajectory Similarity in Linear Time: A Generic Seed-guided Neural Netric learning approach ICDE 2019 |
Traj2SimVec[100] | 进一步提高了NEUTRAJ在数据预处理和训练效率方面的性能 Trajectory Similarity Learning with Auxiliary Supervision and Optimal Matching IJCAI 2020 |
TMN[102] | 提出了一个基于注意力的匹配模块,直接学习两条轨迹中点之间的相关性 “TMN: Trajectory Matching Networks for Predicting Similarity,” in ICDE, 2022, |
T3S[103] | 结合了LSTM和普通自注意模型,以学习欧几里得和网格空间中的轨迹表示 T3S: Effective Representation Learning for Trajectory Similarity Computation,” in ICDE, 2021 |
TrajGAT[104] | 引入了一种基于图的自注意模型,将每条轨迹表示为一个图。 采用四叉树将空间划分为不同大小的网格单元,捕捉点之间的细粒度依赖关系。 TrajGAT: A Graph-based Long-term Dependency Modeling Approach for Trajectory Similarity Computation,” in KDD, 2022 |
- 道路网络
- 这一类别的方法旨在测量映射到道路网络上的轨迹之间的相似性
- 特别适用于城市区域中个人或车辆的轨迹
- 基于SSL的方法
Trembr[105]和LightPath[106] | 分别采用RNN和基于Transformer的Seq2Seq模型 受底层道路网络的限制,它们将轨迹的内在空间和时间属性编码到潜在空间中 LightPath采用知识蒸馏来减小模型大小并提高效率 Trembr: Exploring Road Networks for Trajectory Representation Learning,” ACM Transactions on Intelligent Systems and Technology 2020 Lightpath: Lightweight and scalable path representation learning KDD2023 |
-
- 基于SL的方法
GTS[107] | 首个提供道路网络上轨迹相似性各种定义的先锋 采用GCN和LSTM学习图中POI序列的嵌入 A Graphbased Approach for Trajectory Similarity Computation in Spatial Networks,” in KDD, 2021 |
GRLSTM[108]和GTS+[109] | 分别使用知识图谱和带有时间门的时空LSTM,从时空相似性角度共同捕获轨迹和道路网络属性。 GRLSTM: Trajectory Similarity Computation with Graph-based Residual LSTM,” in AAAI 2023 Spatial-temporal fusion graph framework for trajectory similarity computation WWW 2023 |
SARN[111] | 专注于学习段嵌入,提出了一种基于对比学习的图神经网络,以捕获道路段的局部和全局相似性 Spatial Structure-Aware Road Network Embedding via Graph Contrastive Learning EDBT 2023 |
ST2Vec[110] | 输入LSTM之前集成空间和时间特征 Spatiotemporal Trajectory Similarity Learning in Road Networks KDD 2022 |
4.3.2 轨迹聚类
- 轨迹聚类基于轨迹间的相似性将轨迹分组到不同的簇中,旨在确保同一簇内的轨迹彼此间展现更高程度的相似性
- 传统的轨迹聚类方法[235]通常依赖于相似性测量,且聚类的质量可能因测量的选择而有很大差异
- 当前,基于学习的轨迹聚类方法考虑了轨迹的潜在特征,并且对空间和时间尺度的变化具有鲁棒性
- 基于学习的方法根据其处理工作流程被分类为多阶段方法和端到端聚类
- 多阶段轨迹聚类方法
- 首先为每条轨迹提取低维表示
- 随后,采用传统聚类算法如K-means基于学习到的轨迹表示生成簇
- eg,Trip2Vec[113]
- 从轨迹中提取三种不同的行程属性,包括时间、起点和终点。
- 然后将行程属性输入到一个全连接的自编码器中以生成轨迹的表示
- 接着使用K-means形成具有相似表示的簇
- 端到端方法
- 直接集成深度嵌入聚类(DEC),同时增强轨迹表示和聚类分配
- 多阶段轨迹聚类方法
[114] | 基于AE的t-SNE和DEC进行飞机轨迹聚类 Deep trajectory clustering with autoencoders,” in ICRAT 2020 |
DETECT[115] | 使用基于LSTM的AE和环境上下文共同细化嵌入和聚类分配 “Detect: Deep trajectory clustering for mobility-behavior analysis,” in 2019 IEEE International Conference on Big Data (Big Data), 2019, |
E2DTC[116] | 一种基于RNN的AE方法。它引入了专用于轨迹聚类的三元损失 “E2dtc: An end to end deep trajectory clustering framework via self-training,” in ICDE, 2021 |
4.4 可视化
- 传统的轨迹可视化方法依赖于地理点的时间和空间维度
- 密度图、热图和时空立方体[237]等技术用于宏观分析
- 然而,大量原始轨迹的可视化可能会导致信息冗余
- ——>可是使用深度聚类和简化方法得到解决
[118] | 提出了一个名为Surveillance的交互系统 使用LSTM模型和网络嵌入来检测和可视化城市拥堵情况 “A visual analytics system for exploring, monitoring, and forecasting road traffic congestion,” IEEE transactions on visualization and computer graphics, 2019 |
[120] | 使用迭代采样方案来创建OD流量的有意义的视觉编码 Visual abstraction of large scale geospatial origin-destination movement data IEEE transactions on visualization and computer graphics, 2018 |
[117] | 介绍了DeepHL,使用基于注意力的神经网络自动检测和可视化有意义的轨迹段 Deep learning-assisted comparative analysis of animal trajectories with deephl,” Nature communications, 2020 |
DSAE[119] | 一个深度稀疏自编码器提取隐藏特征,并将它们映射到RGB颜色空间来可视化驾驶行为 Visualization of driving behavior based on hidden feature extraction by using deep learning,” IEEE TITS, v2017 |
[121] | 使用GIS地图集成来增强异常可视化 Deep learning detection of anomalous patterns from bus trajectories for traffic insight analysis,” Knowledge-Based Systems, 2021 |
[238] | 讨论了由DNN辅助的可视化分析 A survey of urban visual analytics: Advances and future directions,” Computational Visual Media, v 2023 |
4.5 LLM+轨迹管理
- 一些文献开始探索使用大型语言模型来执行轨迹管理任务,主要是为了改进轨迹恢复和增强
[239] | 建议使用生成性语言模型分析语义轨迹并创建合成的语义轨迹数据 Spatio-temporal storytelling? leveraging generative models for semantic trajectory analysis arxiv 2023 |
[240] | 使用开源的大型语言模型,如LLaMA2,可以有效地重建飞行轨迹,但面对更长的数据序列时由于令牌长度限制而遇到挑战 “An exploratory assessment of llm’s potential toward flight trajectory reconstruction analysis ARXIV 2024 |
5 轨迹数据挖掘
5.1 轨迹相关的预测
- 在轨迹数据挖掘中,预测任务旨在基于历史数据[24]准确预测个人(即位置预测)或人群(流量预测)的未来移动
5.1.1 位置预测
- 位置预测旨在基于个人的历史移动数据预测其后续的位置。
- 这涉及理解和建模个人的空间(例如,位置)、时间(例如,星期几)、外部(例如,天气)和个性化(例如,周期性访问)模式
- 这可以被构建为一个分类问题,其中下一个位置是几个预定义区域之一;或者作为一个回归问题,预测确切的地理坐标
- 分类模型
- 分类模型从个体访问的历史位置序列中学习,整合深度学习方法来捕获所有可能位置的转移概率分布,其中最高概率表示最有可能的下次访问
DeepMove[122] | 基于注意力的循环神经网络方法 引入了两种注意力机制来捕获多层次的周期性,并使用GRUs处理轨迹进行预测 Deepmove: Predicting human mobility with attentional recurrent networks WWW 2018 |
VANext[123] | 通过使用变分注意力方法进一步增强了DeepMove 该方法利用变分编码来捕获近期移动性的潜在特征,并将其与最近的签到偏好相结合以预测位置 WWW 2019“Predicting human mobility via variational attention |
Flashback[125] | 旨在解决用户移动轨迹稀疏性问题的通用RNN架构 在RNN中使用时空上下文搜索具有高预测能力的隐藏状态以进行位置预测 Location prediction over sparse user mobility traces using rnns IJCAI 2020 |
- 基于回归的方法旨在预测代表个体可能访问的下一个空间点的连续且精确的值
[124] | 引入了一个使用堆叠LSTM层的多任务深度学习框架,以同时预测未来的交通模式和位置 Deeptransport: Prediction and simulation of human mobility and transportation mode at a citywide level IJCAI 2016 |
MobTCast[126] | 引入了Transformer架构作为时空特征提取器,以处理时间和语义上下文(时间、语义、社会和地理) 引入了一个辅助预测任务来探索地理上下文并预测下一个位置 Mobtcast: Leveraging auxiliary trajectory forecasting for human mobility prediction NIPS 2021 |
- 许多近期研究将位置预测扩展到两个变体:
- 下一个POI推荐
- 主要解决冷启动场景和用户偏好推荐
- [252]、[253]
- “A survey on deep learning based point-of-interest (poi) recommendations,” Neurocomputing 2022
- Point-of-interest recommender systems based on location-based social networks: a survey from an experimental perspective,” ACM Computing Surveys (CSUR) 2022
- 预测不完整路径
- 应用于如食品配送和物流等场景中,基于工作人员当前不完整的路线任务预测一系列位置
- [16]、[254]、[255]
- “A survey on service route and time prediction in instant delivery: Taxonomy, progress, and prospects,” ARXIV 2023
- “Package pick-up route prediction via modeling couriers’ spatial-temporal behaviors ICDE 2021
- Graph2route: A dynamic spatial-temporal graph neural network for pick-up and delivery route prediction KDD 2022
- 下一个POI推荐
5.1.2 交通预测
- 预测一定区域内随时间变化的交通流动和密度
- 通常,交通预测被呈现为一个时间序列预测问题,目标是基于过去的观测预测未来的流量
- 可以使用经典的时间序列模型进行预测,如自回归移动平均(ARMA)[258]和向量自回归(VAR)[259]
- 然而,这些直接方法在处理空间依赖性和各种附加特征(例如,天气条件和交通事件)时存在困难
- 可以有效地利用CNN来获取它们的局部和全局时空依赖性【将交通流建模成矩阵的形式】
- 后续的工作也有使用GNN的
- RNN模型如LSTM也可以用来模拟数据内复杂的时间动态
ST-ResNet[127] | 基于深度神经网络预测交通流的先驱性努力之一。 利用残差CNN单元来捕捉时间接近性、趋势和周期模式。 每种类型属性的输出与外部因素聚合,以预测交通流量 Deep spatio-temporal residual networks for citywide crowd flows prediction,” AAAI 2017 |
DMVST-Net[128] | 研究了多视图时空模式 Deep multi-view spatial-temporal network for taxi demand prediction,” AAAI 2018 |
STRCN | 结合了CNN和LSTM进行时空建模,并为不同分支分配权重[129] Spatio-temporal recurrent convolutional networks for citywide short-term crowd flows prediction, ICCDA 2018 |
Periodic-CRN | 专注于捕捉重复的周期模式[130] Periodic-crn: A convolutional recurrent model for crowd density prediction with recurring periodic patternsIJCAI 2018 |
5.2轨迹相关推荐
- 推荐的关键任务包括两个方面:旅行和朋友推荐
- 旅行推荐旨在基于用户的旅行限制和偏好为用户提供合适的路线
- 朋友推荐旨在基于用户的移动模式和行为推断社交关系,并推荐潜在的感兴趣的熟人
5.2.1 旅行推荐
- 旅行推荐的主要目标是基于特定旅行者的特定限制(如持续时间、起点和终点以及要访问的景点数量)生成一系列兴趣点(POI)计划
- 传统上,核心思想涉及使用启发式方法结合POI和轨迹
- 包括五种方法:基于搜索、基于概率、基于仿生、基于聚类和基于约束的方法
- 早期基于DL的方法利用神经网络自动学习A搜索算法的成本函数,用于路线推荐任务
- HRNR[136]使用神经网络扩展A*,为快速驾驶路线推荐建模复杂的交通信息
LD-FeRR[137] | 结合了GRU和注意力机制,以估计长途驾驶路线的燃油消耗,并为司机推荐节能路线 Ldferr: A fuel-efficient route recommendation approach for long-distance driving based on historical trajectories SDM 2021 |
GraphTrip[138] | 构建时空图后集成了位置感知信息融合,并采用迁移学习来解决旅行路线推荐中的数据稀疏性问题 Dual-grained human mobility learning for location-aware trip recommendation with spatial–temporal graph knowledge fusion,” Information Fusion 2023 |
[139] | 多模态方法考虑结合文本和图像信息与轨迹数据,以增强推荐结果 首次结合Google街景图像数据,开发了一个多样化的城市路线推荐系统 Walking down a different path: route recommendation based on visual and facility based diversity,” in Companion Proceedings of the the Web Conference 2018 |
[140] | 将出租车路由问题建模为决策过程,并设计了一种自适应深度强化学习方法 Spatio-temporal feature fusion for dynamic taxi route recommendation via deep reinforcement learning,” Knowledge-Based Systems, 2020 |
5.2.2 朋友推荐
- 在基于位置的社交网络(LBSN)中进行朋友推荐有助于增强用户体验,这源于用户在频繁签到或一起访问相似类型的位置时成为朋友的可能性增加
- 现有工作经常将朋友推荐任务呈现为社交关系推断,其中两个用户成为朋友的概率基于他们的历史签到轨迹和社交关系网络来确定
- 早期工作依赖于用户位置访问的共现频率或兴趣相似性进行推荐
[274] | 展示了地理接近性和用户社交关系之间的相关性 Where online friends meet: Social communities in location-based networks AAAI 2012 |
[275] | 结合用户旅行位置和停留时间,分析用户之间的位置相似性以进行朋友推荐 Friend recommendation for location-based mobile social networks,” in 2013 seventh international conference on innovative mobile and internet services in ubiquitous computing |
[276] | 通过合并GPS轨迹数据构建了一个异构信息网络,并使用随机游走过程来估计链接相关性,并推荐地理朋友 Geo-friends recommendation in gps-based cyber-physical social network,” in 2011 International Conference on Advances in Social Networks Analysis and Mining |
- 后期工作开始使用GNN
LBSN2Vec[141] | 使用用户、时间、空间和语义等各种信息构建超图,并提出了一种随机游走和停留机制,用于关系推断中的自动特征表示 Revisiting user mobility and social relationships in lbsns: a hypergraph embedding approachAAAI 2019 |
LBSN2Vec++ [142] | 考虑到超图的异质性 Lbsn2vec++: ´ Heterogeneous hypergraph embedding for location-based social networks TKDE 2020 |
MVMN[143] | 通过整合社交、空间和时间因素,提出了一个多视图匹配网络,用于朋友推断 “Social link inference via multiview matching network from spatiotemporal trajectories,” IEEE transactions on neural networks and learning systems, 2020 |
TSCI[144] | 使用VAE潜在变量来估计友谊轨迹分布,解决数据稀疏性问题 Trajectory-based social circle inferenc SIGSPATIAL 2018 |
SRINet[145] | 考虑到用户移动数据的噪声特性,引入了一个图神经网络框架,用于移除噪声边缘数据以提高推断性能 Graph structure learning on user mobility data for social relationship inference AAAI 2023 |
FDPL[146] | 考虑到成对排名损失函数以生成前k位朋友推荐,引入了基于贝叶斯个性化排名策略的深度成对学习架构,将朋友推荐视为一个排名任务 Friend recommendation in locationbased social networks via deep pairwise learning ASONAM 2018 |
5.3 轨迹分类
- 涉及从历史轨迹(或子轨迹)数据中学习潜在模式,以将新轨迹识别为相应的类别
- 分类类别包括移动对象的交通方式、动物类型、船只类型、轨迹所有者等
5.3.1 旅行方式识别(TMI)
- 目标是根据移动对象的轨迹对旅行模式进行分类,这些对象在旅程中可能会改变他们的交通方式
- 它可以被构建为多类别或多标签分类任务。
- 此类任务的主要挑战源于不规则样本之间时间间隔的不确定性和轨迹中固有的时空噪声
- 主流方法主要关注序列转换建模
TrajectoryNet[147] | 引入双向GRU架构用于基于点的轨迹分类,通过段信息增强特征并利用Maxout激活函数提高预测精度 Trajectorynet: An embedded gps trajectory representation for point-based classification using recurrent neural networks CASCON 2017 |
[287] | 提出了一个端到端的双向LSTM分类器,通过数据标准化和时间间隔信息提高性能 ISKE 20“End-to-end trajectory transportation mode classification using bi-lstm recurrent neural networ |
ST-GRU[148] | 认识到像RNN这样的离散时间更新模型的局限性,引入了分段卷积权重机制,并使用时间间隔GRU更好地捕捉轨迹的时空相关性和不规则时间间隔。 Spatio-temporal gru for trajectory classification ICDM 2019 |
TrajODE[149] | 提出了一个神经常微分方程(ODE)模型,用于连续的时间动态,将ODE与潜变量结合以增强鲁棒性 Modeling trajectories with neural ordinary differential equations.” in IJCAI, 2021 |
TraClets[150] | 将轨迹转换为光栅图像,将问题转换为图像分类任务,利用成熟的CNN技术 “Traclets: Harnessing the power of computer vision for trajectory classification ARXIV 2022 |
TrajFormer[151] | 有效地将Transformer适用于TMI任务,实现效率和精度之间的平衡,伴随着挤压函数和辅助监督 Trajformer: Efficient trajectory classification with transformers CIKM 2022 |
5.3.2 轨迹-用户链接TUL
- 与将轨迹分类到不同移动模式不同,轨迹-用户链接任务已发展为将匿名语义轨迹与其相应的用户关联起来
- 由于在理解人类移动模式方面的有效性,这项任务已被证明在促进诸如追踪流行病患者和启用智能商务服务等努力方面非常有价值
- 具体来说,给定一个匿名轨迹,TUL任务旨在识别数据库中与该旅程相对应的实际用户
- 这项任务的主要挑战源于由于语义轨迹的稀疏性和对人类移动性层次语义方面的细腻理解的困难,捕捉模式变得困难
TULER[11] | 第一个解决TUL问题的研究。 它利用基于RNN的模型来识别签到轨迹并将它们链接到生成的用户。 TULER将POI序列作为输入,采用词嵌入进行表示,并使用RNN捕捉移动模式和建立用户链接 ↓RNN模型缺乏对人类移动性层次语义的全面理解 Identifying human mobility via trajectory embeddings.IJCAI 2017 |
TULVAE[12] | 通过将变分自编码器引入TUL任务来提高预测精度 解决了稀疏性问题并学习了层次语义 ↓没有充分利用丰富的特征并忽略了多周期移动模式 “Trajectory-user linking via variational autoencoder IJCAI 2018 |
DeepTUL[152] | 使用带有注意力机制的RNN来缓解数据稀疏性,捕捉多周期模式以提高准确性。 Trajectory-user linking with attentive recurrent network n Proceedings of the 19th international conference on autonomous agents and multiagent systems, 2020 |
MainTUL[153] | 引入了具有短期和长期依赖性的不同轨迹编码器的相互蒸馏学习,提高了准确性 Mutual distillation learning network for trajectory-user linking,” in IJCAI, 2022 |
AdattTUL[154] | 采用了GANs “Adversarial mobility learning for human trajectory classification,” IEEE Access, 2020 |
SML-TUL[291] | 使用对比学习并考虑了时间和空间约束 Self-supervised human mobility learning for next location prediction and trajectory classification,” Knowledge-Based Systems, 2021 |
5.3.3 其他视角
SECA[155] | 提出了一种半监督方法,结合了Conv-AE和CNN分类器,共同训练标记和未标记的GPS段 Semi-supervised deep learning approach for transportation mode identification using gps trajectory dat TKDE 2019 |
[292] | 介绍了一种基于代理标签的半监督算法 “Semi-supervised deep ensemble learning for travel mode identification,” Transportation Research Part C 2020 |
SSFL[156] | 扩展了[292]这个框架用于联邦学习 Semi-supervised federated learning for travel mode identification from gps trajectories,” IEEE TITS,2021 |
DeepCAE[157] | 提出了一种结合预训练Conv-AE和聚类的无监督方法,用于TMI任务 “Unsupervised deep learning for gpsbased transportation mode identification, ITSC 2020 |
[293] | 针对有限数据场景,使用小波变换 “Improving transportation mode identification with limited gps trajectories ICTAI 2021 |
[294] | 针对有限数据场景,结合了地图匹配算法 A framework of travel mode identification fusing deep learning and map-matching algorithm,” IEEE TITS, 2023 |
S2TUL[158] | 通过多样图捕捉未标记数据的复杂运动关系 S2tul: A semisupervised framework for trajectory-user linking Proceedings of the sixteenth ACM international conference on web search and data mining, 2023 |
DPLink[159]和EgoMUIL[295] | 解决了跨平台异构数据的TUL问题 Dplink: User identity linkage via deep neural network from heterogeneous mobility data WWW 2019 |
AttnTUL[13] | 引入了一个层次注意力网络,有效地使用GNN处理稀疏和密集轨迹 Trajectory-user linking via hierarchical spatio-temporal attention networks TKDD 2024 |
5.4 旅行时间估计
- 旅行时间估计(TTE),也被称为预计到达时间(ETA)
- 传统方法依赖于轨迹的起点和终点以及历史数据,但可能忽略了路径选择和道路条件等因素。
- 为了解决这些限制,现代TTE方法已发展成两个主要类别:基于轨迹和基于道路的,两者都旨在整合各种时空数据以提高准确性
5.4.1 基于轨迹的估计
DeepTTE | 通过地理信息卷积引入地理信息,增强空间相关性和时间依赖性理解[160] When will you arrive? estimating travel time based on deep neural networksAAAI 2018 |
[161]–[164] |
Deeptravel: a neural network based travel time estimation model with auxiliary supervision,” arXiv preprint arXiv:1802.02147, 2018 Multi-task representation learning for travel time estimation KDD2018 Context-aware road travel time estimation by coupled tensor decomposition based on trajectory data,” Knowledge-Based Systems,2022 Ttpnet: A neural network for travel time prediction based on tensor decomposition and graph embedding,” KDD 2020 |
- 基于轨迹的TTE面临挑战,尤其是已知未来GPS位置的假设,和对GPS采样频率和准确性假设不切实际
- ——>这些限制凸显了基于道路的TTE作为一种更可行的替代方案的潜力,鉴于其依赖较少精确、高频率GPS数据的能力
5.4.2 基于道路的估计
- 基于道路的TTE方法将行程定义为一系列道路,重点在于建模它们的相关性,以支持多样化的路线选择,从而克服轨迹依赖性的限制
WDR[165] | 通过整合了广泛线性模型、深度神经网络和循环神经网络,利用全面的旅行特征集来进行准确的旅行时间预测 “Learning to estimate the travel time KDD 2018 |
[166],[299] | 包括道路网络度量学习和个性化驾驶偏好框架,增强了模型对道路序列和个人驾驶行为的敏感性 Codriver eta: Combine driver information in estimated time of arrival by driving style learning auxiliary task,” IEEE TITS 2020 |
PathCNN | 利用子路径图像进行时空分析,标志着路线表示的新方法 |
[168],[169] | 应用GNN来将道路网络建模为异质信息图或采用时空图注意力机制 KDD 2020Heteta: Heterogeneous information network embedding for estimating time of arriva Constgat: Contextual spatial-temporal graph attention network for travel time estimation at baidu maps KDD 2020 |
5.4.3 其他角度
[172],[173] | 将TTE视为多分类挑战,根据行程时间分布将旅行时间分类到不同的跨度中,以缓解长尾效应,提供了准确性改进的新视角 Cateta: A categorical approximate approach for estimating time of arrival,” IEEE TITS, 2022 “Uncertainty-aware probabilistic travel time prediction for on-demand ride-hailing at didi KDD 2023 |
途中TTE(ER-TTE) | 利用观察到的和未来的路线行为来适应性地细化旅行时间估计,展示了对时空动态和用户偏好的高级理解[171],[303] “Ssml: Self-supervised meta-learner for en route travel time estimation at baidu maps KDD 2021 “Metaer-tte: An adaptive meta-learning model for en route travel time estimation IJCAI 2022 |
研究已扩展到专门领域
不确定性 | [296]、[304] Privacy-preserving travel time prediction with uncertainty using gps trace data,” IEEE Transactions on Mobile Computing, 2021 Cross-area travel time uncertainty estimation from trajectory data: a federated learning approach,” IEEE TITS 2022 |
跨区域 | [304] Cross-area travel time uncertainty estimation from trajectory data: a federated learning approach,” IEEE TITS 2022 |
旅行时间分布估计 | [297]、[305] Citywide estimation of travel time distributions with bayesian deep graph learningTKDE 2021 “Travel time distribution estimation by learning representations over temporal attributed graphs,” IEEE TITS, 2023. |
5.5 异常检测
- 轨迹异常检测旨在识别对象的异常移动。它在实践中有广泛的应用,如叫车服务的欺诈和危险检测、交通拥堵检测和轨迹清洗
- 早期方法主要利用手工制定的规则来定义正常/异常轨迹
TRAOD[306] | 通过基于距离和密度的规则检测离群子轨迹 Trajectory outlier detection: A Partition-and-Detect Framework ICDE 2008 |
- 轨迹异常检测方法可以根据应用场景分为两类:离线检测和在线检测
- 离线方法只能在提供完整轨迹后进行处理,而在线方法支持在正在生成的轨迹上进行“即时”检测
- 在线方法比离线方法更灵活,因为它们也可以通过将完整轨迹视为逐步生成的轨迹,在离线方式下使用
5.5.1 离线检测
ATD-RNN[174] | 简单地结合了RNN模型和FC层,在欧几里得空间预测轨迹异常 Anomalous Trajectory Detection using Recurrent Neural Network,” in Advanced Data Mining and Applications. Springer, 2018, |
IGMM-GAN[175] |
|
TripSafe[176] | 专注于叫车服务行程异常检测,考虑了下单时间和停留时长等因素 利用两个VAE,它在欧几里得空间和道路网络中学习轨迹表示 Coupled igmmgans with applications to anomaly detection in human mobility data,” ACM Transactions on Spatial Algorithms and Systems (TSAS), 2020 |
ATROM[307] | 利用变分贝叶斯方法,在概率度量规则的指导下探索轨迹的行为模式,解决开放世界场景下的异常轨迹识别问题。 Open anomalous trajectory recognition via probabilistic metric learning IJCAI 2023 |
5.5.2 在线检测
DB-TOD[177] | 研究道路网络上的在线轨迹异常检测。 利用强化学习模拟历史轨迹之间道路段的转移概率,从而使异常检测成为一个顺序决策过程 A Fast Trajectory Outlier Detection Approach via Driving Behavior Modeling CIKM 2017 |
RL4OASD[178] | 另一个概率模型 改进了特征生成过程,并引入了旨在强调标签的局部连续性的局部奖励 “Online Anomalous Subtrajectory Detection on Road Networks with Deep Reinforcement Learning,” in ICDE 2023 |
GM-VSAE[179] |
|
DeepTEA[180] | 在GM-VSAE的基础上,进一步考虑了时间维度 Online Anomalous Trajectory Detection with Deep Generative Sequence Modeling,” in ICDE IEEE 2020 |
5.6移动性生成
- 轨迹数据在实际应用场景中面临如有限的公共数据、隐私问题和授权问题等挑战。
- 轨迹生成是这些障碍的一个可行解决方案,它不仅遵循隐私要求,而且通过合成现实轨迹数据来支持更广泛的研究和应用需求
- 轨迹生成专注于创建生成器以模拟复杂的人类或对象移动模式,利用深度学习来封装实际轨迹的统计、空间和时间细微差别,旨在使生成的数据与现实世界模式紧密对齐
- 合成现实轨迹数据的努力根据规模分为两个主要视角:宏观动态和微观动态
- 宏观动态关注广泛的移动模式,如城市和地区内或跨城市和地区的人口移动,强调大规模趋势的建模,而不是个别轨迹
- 微观动态专注于个体的详细移动模式,包括特定路线、速度和停留点
5.6.1 宏观动态
- 传统上方法
- 基于历史数据和移动假设的统计模型和模拟[309]
- Unraveling the origin of exponential law in intra-urban human mobility,” Scientific reports, 2013
- 引力模型和辐射模型在预测流量方面起到了关键作用,考虑了人口密度和地理距离等因素[310]
- Human mobility: Models and applications,” Physics Reports, 2018
- ↓这些方法可能过于简化了人类移动性的复杂动态
- 基于历史数据和移动假设的统计模型和模拟[309]
- 神经网络揭示了复杂的空间和时间移动模式
- FC、CNN、RNN和GAN都为更细致和动态的流量表示做出了贡献
- “Citywide traffic flow prediction based on multiple gated spatio-temporal convolutional neural networks TKDD 2020
- “Spatiotemporal scenario generation of traffic flow based on lstmgan,” IEEE Access 2020
- Trafficgan: Network-scale deep traffic prediction with generative adversarial nets,” IEEE TITS, v 2019
- Traffic flow imputation using parallel data and generative adversarial networks,” IEEE TITS, 2019
- “Gans based density distribution privacypreservation on mobility data,” Security and Communication Networks 2018
- [128]
- 引入了一个利用局部空间网络的空间交互GCN模型,以改进地理单元表示
- Deep multi-view spatial-temporal network for taxi demand prediction,” AAAI 2018
- FC、CNN、RNN和GAN都为更细致和动态的流量表示做出了贡献
5.6.2 微观动态
- 在微观层面,轨迹生成旨在复制复杂的个体移动,捕捉访问位置序列、停留时间、选择的路线和时间
- 早期努力侧重于将下一位置预测视为顺序任务,但这些通常受制于历史轨迹数据的需要
- [122]、[311]–[313]
- Deepmove: Predicting human mobility with attentional recurrent networks,”WWW 2018
- Deeptransport: Prediction and simulation of human mobility and transportation mode at a citywide level IJCAI 2016
- Wherenext: a location predictor on trajectory pattern miningKDD 2019
- How do you go where? improving next location prediction by learning travel mode information using transformers,” in Proceedings of the 30th International Conference on Advances in Geographic Information Systems, 2022.
[314] | 一个轨迹混合模型,尽管它需要大量数据和复杂过程才能有效生成 Towards trajectory anonymization: a generalization-based approach,” SIGSPATIAL 2008 |
[315] | 从网格映射的轨迹数据中学习,生成现实路径 ↓尽管有所改进,但这些模型面临与网格大小和准确性之间平衡相关的限制' A nonparametric generative model for human trajectories,” in IJCAI, vol. 18, 2018 |
[190]、[316]–[319] | 引入强化学习,以生成器为代理和用于奖励计算的鉴别器 Learning to simulate human mobility, KDD2020 “Trajgail: Generating urban vehicle trajectories using generative adversarial imitation learning,” Transportation Research Part C: Emerging Technologies, vol. 128, 2021 Activity trajectory generation via modeling spatiotemporal dynamics KDD 2022 “Learning to simulate daily activities via modeling dynamic human needsWWW2023 |
[187]、[189] | 将轨迹数据转换为图像进行生成,尽管这引入了额外的计算复杂性 2021“Large scale gps trajectory generation using map based on two stage gan,” Journal of Data Science Generating mobility trajectories with retained data utility,” KDD 2021 |
DiffTraj[191]和Diff-RNTraj[320] | 引入去噪扩散概率模型,将生成模拟为粒子扩散运动,以创建详细路径。 NIPS 2023Difftraj: Generating GPS trajectory with diffusion probabilistic model |
5.7 LLM+轨迹挖掘
预测 | [192]、[193]、[321]、[322] Where would i go next? large language models as human mobility predictors ARXIV 2023 Exploring large language models for human mobility prediction under public events ARXIV 2023 Prompt mining for language-based human mobility forecastingARXIV 2024 Urbangpt: Spatio-temporal large language models ARXIV 2024 |
生成 | [323]、[324] Large language models as urban residents: An llm agent framework for personal mobility generation ARXIV 2024 Mobilitygpt: Enhanced human mobility modeling with a gpt model, ARXIV 2024 |
识别 | [325]“Are you being tracked? discover the power of zero-shot trajectory tracing with llms!A RXIV 2024 |
这些工作在无需专门训练数据集的情况下准确预测人类移动性方面展现了卓越性能
6 应用
6.1 个人服务
- 路线检测
- 用户驾驶轨迹的分析能够及时识别和通知替代路线或避开交通拥堵,从而提高旅行效率
- 拼车服务
- 平台可以智能匹配同一方向旅行的乘客,实现更有效的共享乘车,降低旅行成本,并减轻交通负担
- 个性化推荐服务
- 利用轨迹数据分析来了解用户的偏好位置和行为模式,为附近的景点、餐馆和商业区提供更加量身定制的推荐
6.2 商业平台
- 商业选址
- 潜在顾客的移动轨迹分析使企业能够就最佳运营地点做出明智的决策,从而提高业务成功的可能性
- 物流和配送服务
- 实现实时监控和合理的路线规划,以提高配送效率和降低运营成本
- 个性化营销策略
- 利用轨迹数据分析来理解用户行为,实施更加个性化的营销方法以增加用户参与度
6.3政策指导
- 交通管理
- 轨迹数据分析允许智能调整交通信号和合理规划交通流,从而提高城市交通效率
- 城市规划
- 利用轨迹数据为城市规划提供更准确的基础,通过了解城市居民的活动轨迹,促进城市基础设施和土地使用的科学规划
- 资源分配和疾病控制
- 受益于轨迹数据挖掘,使政府能够更准确地分配城市资源,并迅速响应不同区域的需求
- 危险(犯罪)检测
- 轨迹数据的应用有助于识别异常行为,增强城市安全,使执法机构能够更有效地干预和预防潜在的犯罪事件
7 资源
7.1 数据集
7.2 工具
8 挑战与方向
8.1 当前挑战
8.1.1 数据
标准化轨迹数据管理 | 缺乏标准化阻碍了轨迹数据的统一处理和应用,需要开放和标准化的管理方法以实现无缝集成 |
获取多源语义轨迹数据 |
|
构建全面的轨迹数据集 |
|
8.1.2 模型
建模运动行为中的不确定性 | 处理轨迹数据中的不确定性,其稀疏、噪声和长尾分布需要适应现实世界移动复杂性的鲁棒模型 |
统一模型设计 | 特定的模型架构阻碍了在轨迹数据中探索统一模式。设计不同任务的统一模型尤其具有挑战性 |
鲁棒、可靠和稳定的轨迹建模 | 现有模型在极端异常值,特别是在实际应用中缺乏鲁棒性。确保模型的可靠性是必要的 |
8.1.3 算法
多源轨迹数据的融合算法 | 现有的多源轨迹数据算法可以更高效。鲁棒的算法对于融合不同数据类型的全球解释能力至关重要 |
完全端到端算法设计 | 完整的端到端算法简化了结构并提高了效率,解决了当前轨迹模型的多阶段性质 |
轻量级和高效算法设计 | 在资源受限的边缘设备上提高轨迹计算算法的效率对于实际应用至关重要 |
8.2 未来方向
8.2.1 从预测到规划
通过整合深度强化学习和多代理游戏,轨迹计算从单纯的预测进步到实时智能决策
8.2.2解决分布偏移
- 轨迹数据通常从不同地点和时间段收集,导致训练和推理之间存在显著的分布差异
- 由于这些分布偏移,一个数据集上训练的模型可能在其他数据集上表现不佳
8.2.3 多模态融合
- 人类移动不可避免地与多种形式的数据相关,如视觉、传感器或文本
- 此外,不同类型的轨迹,如出租车路线、共享单车记录和公共交通流量,从不同角度提供了对人类移动性的见解
- 开发一个有效的统一框架,整合多样化模态数据以更全面捕获移动模式和精确预测,需要进一步研究关注
8.2.4 基础模型和大型语言模型
- 当前的轨迹计算,特别是在挖掘任务中,通常依赖于特定数据和场景模型,缺乏通用性和外部知识
- 潜在的研究途径包括但不限于,从LLMs中提炼知识以辅助现有模型,微调或直接利用LLMs完成当前任务,以及将LLMs视为决策代理
8.2.5 可解释性
- 到目前为止,轨迹计算中的大多数深度学习努力都集中在通过复杂模型设计提高任务性能上
- 这些黑箱模型的可解释性研究显著缺失,不清楚哪些关键因素主要贡献于改进的预测性能