Trajectory Mining
「已注销」
https://github.com/jiaoshuhai
jiaoshuhai@gmail.com
展开
-
轨迹挖掘综述
轨迹挖掘系统框架轨迹挖掘分为6个模块:模块1(轨迹预处理):1.噪声清洗、2.分段、3.停留点检测、4.压缩、5.地图匹配模块2(轨迹数据管理、查询、编码):1.top-k最近的邻居查询、2.一个范围查询、3.历史数据查询、4.最近(实时)数据查询模块3(轨迹的不确定性研究):1.减少轨迹的不确定性,具体来说,轨迹是连续的,轨迹点是离散的,减少两个轨迹点之间不 确定性。2.保护乘客的隐私。具体来说...原创 2018-04-08 14:45:45 · 5552 阅读 · 1 评论 -
Table of blog contents
本博客旨在分享大数据领域的两部分部分知识:理论与工具。特别地,本博客重点关注轨迹挖掘的理论与应用。(需要说明的是,本人在博客分享的过程中,参考了很多论文、书籍、资料等等。为了方便更新博客,在此将相关参考文献一并给出)1)理论知识: 数据挖掘系列 机器学习系列 深度学习系列2)基础工具...原创 2018-05-31 09:11:42 · 376 阅读 · 0 评论 -
轨迹格式转换(将轨迹转化为图)
将轨迹转化为图的核心是如何定义点和边。方法可以分为两类:一种使用了路网,另一种没有使用路网1)使用了路网:第一种方法:第一步:将轨迹转化为路网第二步:根据轨迹的速度、交通量计算每条边的权重第三步:基于带有权重的图,发现相似路径、最受欢迎的路径、检测交通异常、更新路网第二种方法:构建一个landmark 蓝色是高频点,红色是高频线第三种方法:构建一个region graph将城市分为候选活动区域每个...原创 2018-05-22 22:14:44 · 3573 阅读 · 1 评论 -
轨迹数据管理(轨迹索引与查询)
轨迹查询主要两类,一种是top最近查询,另一种是范围查询。范围查询:一个时间段、一个区域3种方法可以用来范围查询:1)建立3D-Rtree。2)将时间切段3)将空间分格4) 希尔伯特曲线topK查询后缀树的思想...原创 2018-05-02 15:19:03 · 4075 阅读 · 1 评论 -
轨迹挖掘——轨迹模式挖掘
从一条轨迹或者从一组轨迹中挖掘出行模式可以分为四类:1)共同移动模式2)轨迹聚类3)时序模式4)周期性的模式1)共同移动模式flock(群):在一个小的固定形状的区域内,多个目标连续k个时间戳同时移动。由于事先定义的形状不太能确定,因此会出现损群问题。convoy(护卫,车队)任意形状,通过密度来确定一个区域swarm(大群):上面两个都必须要求是连续的,这个算法是要求不是连续的。,traveli...原创 2018-05-02 14:44:57 · 5503 阅读 · 1 评论 -
轨迹不确定性研究—(减少轨迹点之间的不确定性+轨迹隐私保护)
减少轨迹不确定性分为两类:查询建模如上图所示,当我们需要查询经过R区域的轨迹时,灰色轨迹(低采样率)是否应该包含在内。使用独立的概率密度函数在每个时间点或随机过程(如马尔可夫链),以更好地模拟对象的不确定位置,并回答不同的查询。第二类为:从不确定性轨迹中进行路径推测。核心思想:通过多条不确定性轨迹,确定确定性轨迹。如几条轨迹的交汇点为确定点。具体来说,有两种具体方法:第一种方法:一种是为道路网络环...原创 2018-04-13 20:30:49 · 2646 阅读 · 0 评论 -
轨迹预处理(地图匹配Map Matching)
地图匹配Map Matching可以按照两个标准分类两类一种是是否使用了额外的信息,另外一种是轨迹中采样的范围。第一种方法可以分为四类:几何、拓扑、概率、先进技术几何:将GPS点匹配到最近的道路。拓扑:使用frechet distance。计算一段轨迹和一条道路的frechet distance,如果小于阈值,则匹配。概率:为了解决轨迹噪声和低采样率问题。概率算法对GPS噪声作了明确的规定,并通过...原创 2018-04-09 11:27:25 · 18778 阅读 · 9 评论 -
轨迹预处理(轨迹分段)
在轨迹聚类,分类之前,我们通常要将轨迹分段。第一种轨迹分段方法是利用“时间间隔”分段。具体来说,如果两个轨迹点之间的时间差较大,则进行分段;另外一种则是按照时间段将轨迹分段。第二种方法是基于轨迹的形状。具体来说,基于轨迹点方向的角度变化大小分段,如果变化超过一定的阈值,则分段;另外一种方法“线简化”算法。类似轨迹压缩算法,轨迹压缩点为分段点。第三种方法是基于语义信息,基于停留点分段。还有一种是基于...原创 2018-04-09 10:52:08 · 11619 阅读 · 0 评论 -
异常轨迹检测(识别偏航轨迹+轨迹异常原因识别)
偏航轨迹有两种,一种是整个轨迹全部偏航,另一种是部分轨迹偏航。基本的思想是将轨迹进行聚类,或者找出两地间频繁的出行模式。如果一条轨迹不属于任何一个聚类,则认为轨迹偏航轨迹异常原因有多种,包含事故、交通控制、抗议、庆典、灾难、大型体育运动等轨迹异常原因识别:1)根据主要路网形状,将城市分为一个个不相连的区域,并根据两个区域之间行驶的车辆的轨迹,识别两个区域之间的异常联系。2)考虑每个道路的三个特征:...原创 2018-04-08 22:33:17 · 12087 阅读 · 0 评论 -
轨迹预处理(轨迹清洗)-卡尔曼滤波、扩展的卡尔曼滤波、粒子滤波在轨迹清洗中的应用
1.卡尔曼滤波、扩展的卡尔曼滤波、粒子滤波的理论与应用 GPS是全球卫星定位系统,可以帮助我们获得经纬度坐标。GPS在汽车上的广泛装备与应用,可以很方便地帮助我们获得海量的汽车轨迹信息。然而,GPS设备有时存在定位误差较大的问题[1],导致轨迹中存在一些漂移点、回跳点、缺点等。这些点将会影响我们对路网拓扑结构的研究。因此,本文利用卡尔曼滤波对轨迹进行清洗。 简单来说,卡尔曼滤...原创 2018-07-19 15:08:26 · 11978 阅读 · 13 评论 -
轨迹预处理(轨迹压缩)
轨迹压缩分为在线压缩和离线压缩两类。在介绍两类压缩算法之前,本文先介绍两种“距离度量”方法第一种距离度量方法是:垂直的欧几里得距离,如图b所示,p1、p7、p12作为压缩后的点。“垂直度量”则为做垂线计算。第二种距离度量方法是:时间同步的欧几里得距离,如图a所示,p1、p7、p12作为压缩后的点。p1与p2之间是3秒,p2与p3之间是2秒,物体移动的速度是恒定的,通过这种方法计算时间同步的欧几里得...原创 2018-04-08 15:42:36 · 6662 阅读 · 0 评论 -
轨迹预处理(停留点检测)
停留点分为两类:静止不动停留点、徘徊型停留点静止不动停留点:通过距离阈值、速度等即可识别徘徊型停留点: 1. 对于一个轨迹点g来说,找到距离它100米的一个点g100; 2.统计g 和g100之间的时间跨度 3.如果时间跨度超过阈值,则将中间的点识别为停留点...原创 2018-04-08 15:01:29 · 11130 阅读 · 0 评论 -
轨迹预处理(轨迹清洗)-均值中值滤波、启发式滤波
均值、中值滤波对于一个轨迹点g来说,要想判断该点是否合理。选取g点之前的n个点,通过G点之前n个点平均距离,判断轨迹点g是否合理。启发式滤波对于一个轨迹点g来说,要想判断该点是否合理。选取g点d米范围之内的所有轨迹点,统计这些轨迹的个数number。对于一条轨迹来说,统计每个点的d米范围之内的所有轨迹点的个数,该个数用t_number表示。如果number < t_number ,则考虑该轨...原创 2018-04-08 14:56:22 · 9218 阅读 · 1 评论 -
The poster of my master's degree thesis.
原创 2018-06-07 20:58:39 · 382 阅读 · 1 评论