摘 要: 基于地理位置信息的应用和服务的迅速发展,对轨迹数据挖掘提出了新的需求和挑战.原始轨迹数据通 常是由坐标-时间戳元组构成的有序序列,而现有的大多数数据分析算法均要求输入数据位于向量空间中.因此,为了将轨迹数据从变长的坐标-时间戳序列转化成定长的向量表示且保持原有的特征,对轨迹数据进行有效的表示是十分重要且必要的一步.传统的轨迹表示方法大多是基于人工设计特征,通常仅将轨迹表示作为数据预处理的一部分.随着深度学习的兴起,这种从大规模数据中学习的能力使得基于深度学习的轨迹表示方法相比于传统方法取得了巨大的效果提升,并赋予了轨迹表示更多的可能性.对轨迹表示领域中的研究进展进行了全面的总结,将轨迹表示按照研究对象的不同尺度,归纳为对轨迹单元的表示和对整条轨迹的表示两大类别,并在每种类别下对不同原理的 方法进行了对比分析.其中重点分析了基于轨迹点的表示方法,也对近年来广泛使用的基于神经网络的轨迹表示的 研究成果做了系统的归类.此外,介绍了基于轨迹表示的关键应用,最后对轨迹表示领域的未来研究方向进行了 展望.
关键词: 轨迹数据挖掘;轨迹表示;时空数据挖掘
中文引用格式: 曹翰林,唐海娜,王飞,徐勇军.轨迹表示学习技术研究进展.软件学报,2021,32(5):1461−1479. http://www.jos. org.cn/1000-9825/6210.htm
1 轨迹表示概述
1.1 相关定义
轨迹、轨迹离散采样、轨迹表示
1.2 轨迹表示难点
轨迹不同,属性不同;轨迹数据的时空相关性;深度学习(CNN,RNN)易受端到端训练框架限制
1.3 方法分类
标准一:使用模型——CNN,RNN,LSTM,Seq2Seq
标准二:轨迹数据尺度