【可视化笔记-VR&VIS SWUST-2018】《SemanticTraj: 基于语义的大规模出租车轨迹交互分析方法》_Shamal AL-Dohuki_陈为_ZJU

后面看到基本就是近三年TVCG的一些论文了。

SemanticTraj: A New Approach to Interacting with Massive Taxi Trajectories

下载链接提取码0vxr

这篇文章是浙大做的一个关于语义的轨迹分析方法,主要工作是在数据的处理上。论文总结在最后。

简单说一下我阅读这篇文章的一些思路

  • 回答一些看似简单的问题:中午到万达广场的出租车从哪里来? 早上去上班,从西科大到步行街的出租车行程是怎么样的。

  • 西科大、步行街、万达广场没有直接的相互关联。

  • 所以我们诞生了这套系统,SemanticTraj,这种直观的,具有丰富语义的,且高效的方式来将管理和可视分析出租轨迹数据。

  • 通过这套系统,没有经过专业训练的用户可以像使用我们熟悉的google,百度一样,基于术语来直接查询并轻松找到上述问题的答案。而且还可以使用交互功能,通过文本化的轨迹和行程信息,来检索可视化系统中的数据。

  • How to answer seemingly simple Q:

What were the taxi trips starting from SWUST and ending at buxingjie in this moring?
Where are the taxis arriving at the Wanda at noon typically coming from?

  • Not directly linked to keywords such as “SWUST”,”buxingjie”&”Wanda”

  • SwmanticTraj:a new method for managing & visualizing taxi traj. data in an intuitive, semantic rich & efficient means

  • 举例:

  • 例1: 购物中兴希望开通穿梭巴士,经理想要调查客人乘坐出租车到达商场的地点和时间(起始位置)。对于抵达商场的出租车,他们的上车点是什么。

  • 以前的系统:1、地图上选择商场周边的区域并显示上下车的点,2、选择时间段,3、过滤这个区域内与“在商场下车”有关的地点,4、在地图上显示客人的上车点,5、通过地图找出高频上车点。

  • 例2: 两个目击者报告犯罪嫌疑人在下午3点-3点20之间乘坐出租车转过南街和北街。警察想要找出可以出租车的路径。所以需要下午3点-3点20之间经过南街和北街的出租车的行程是什么样的,他们在那些街道停留,POI是哪些。

  • 以前的系统:1、地图上选择北街周围的区域,2、选择时间段3点-3点20,3、过滤并选择在北街的所有GPS采样点,4、用上一步中选择的点显示同一辆出租车行程,5、重复以上步骤选择南街,6、找到这些出租车走过的其他街道。

  • Scenario1: A shopping mall has a plan to open shuttle buses for their customers. Its manager wants to investigate where and when visitors take taxis to the mall.

  • Task1: For the taxi trips arriving at the shopping mall, what are their major pick-up locations?

  • Scenario2: Two witnesses reported a criminal suspect taking a taxi passing South Street and North Street between 3pm and 3:20pm. A policeman wants to find suspicious taxi paths

  • Task2: What are the taxi trips passing South Street and North Street between 3pm and 3:20pm? What are the other streets/POIs they visited?

显然这些步骤要求用户接受地图操作的培训,这种培训可能会妨碍普通用户使用系统。所以本文帮助用户通过另外一种方式完成任务,就像用户使用google或者百度一样,在搜索引擎中填入关键字来查询。比如针对任务2,,警察输入:选择在3点-3点20之间,经过北街和南街所有的出租车。然后就在地图上显示所有符合条件的形成以及文本标签,并且通过简短的文本摘要,让警察立即找到所需求的街道的名称。

SemanticTraj需要解决的事情:

  • 在特定时间内经过该街道的出租车行程
  • 在特定时间内且不同逻辑情况下经过多条街道的出租车行程
  • 出租车行程的单个或者多个POI
  • 出租车在经过给定街道和POI的轨迹
  • 出租车的不同速度所表现出来的特殊行为的描述:快慢 等

Need to :
Task1: Taxi trips passing a street in a given time period;
Task2: Taxi trips passing multiple streets in given time periods with different logic conditions;
Task3: Taxi trips with single or multiple POIs;
Task4: Taxi trajectories passing given streets and POIs;
Task5: Taxi trajectories with specific behaviors in travel speed(e.g., slow, fast, change from slow to fast).

在这里插入图片描述第一步:将出租车轨迹进行文本化后生成轨迹文件和行程文件,这种文本化是将地理位置GPS点投影到街道上,并将出租车的速度值映射为描述。出租车轨迹文本化后的出租车文件一方面行程行程文件,包括的是出租车载客经过的街道。另一方面是轨迹文件,包括出租车在一个时间周期内行驶过的所有街道。
第二步:所有的出租车轨迹数据都转换为出租车文件后,建立索引方案,索引方案是为这个库而设计的。然后再使用文本搜索引擎来管理出租车文档。
第三步:使用交互式可视分析系统,用户通过文本搜索功能查询数据,并通过可视化方法来呈现查询结果。查询结果是具有语义标签和摘要的,用户可以轻松理解结果。
1、轨迹数据挖掘和可视分析
2、空间轨迹管理
3、语义轨迹管理:我们是通过精准的街道名称,出租车的状态和时间范围来进行可视化,街道成为查询单元而不是区域,并且GPS点映射在街道上后,我们通过文本搜索引擎来查询。
在这里插入图片描述出租车轨迹文本化
1、将GPS点映射在街道上
2、相关属性被转换成文本信息
这种方式,通过文本搜索可以找到所描述的特定行为。

出租车文件:
行程文件:上下街道,上下时间,距离,票价,GPS信息用于绘制轨迹
任务一:通过街道S的上下车的点
查询:在文件C里面查询S街道名
任务二:在S1街道T1时间上客并且在S2街道T2时间把他们放下
查询:输入S1在上客街道上客时间查询并且输入S2在下客街道下客时间查询

轨迹文件:
任务一:我们有在T时间经过S的所有出租车轨迹数据,那么他们的平均速度是多少,有多少车有乘客
查询:S接到在C文件(规定T时间)
任务二:有哪些出租车在T时间内从慢到快突然加速
查询:慢 非常快 在Dspeed中查询文件C(规定T时间)
这种查询方法可以显示出出租车的轨迹可能存在违反交通法的行为,这种文本化工作和使用文本搜索引擎,是给用户提供一种新的可视化工具来进行分析

在这里插入图片描述灵活的搜索功能
支持街道和POI查询,速度描述查询。支持布尔,通配符,模糊等查询方式
布尔查询:可以同时检索多个任务条件
范围查询:查询时间,票价
通配符和模糊:不知道街道的情况下
邻近查询Proximity:slow veryfast之间的文档,帮助用户快速找到一些异常事件
在这里插入图片描述数据处理和查询性能:杭州人口250我,一个月数据2011.12.1-12.31有77GB,有8120辆出租车,每天原始2.5GB,经过
删除错误重复记录
文本化,添加街道名称和速度秒速
相同出租车ID创建轨迹,按时间拍讯,顺序存储,每10分钟一个轨迹段,连接获得完整的每日轨迹
找出行程
最后是38GB
通过建立的索引,查询速度很快
F. Wang, W. Chen, F. Wu, Y. Zhao, H. Hong, T. Gu, L. Wang, R. Liang, and H. Bao. Visual reasoning approach for data-driven transport assess-ment on urban road. In IEEE Conference on Visual Analytics Science and Technology, pp. 103–112. IEEE, Oct. 2014.
别人712秒,Q1是0,53秒,他们是336秒索引,Q1 0.21秒

在这里插入图片描述设计合理性:
帮助用户轻松地查询他们的想法,直接输入语义名称和术语,通过熟悉的百度搜索的方式,文本搜索
对查询结果的快速理解:使用语义信息:文本标签和摘要(meta-summary),增强用户理解
简单的交互来引导用户进行探索:提供散点图,平行坐标等等,来深入挖掘

在这里插入图片描述为游客提供穿梭巴士服务:游客通过出租车来博物馆,管理员通过自己的POI来查询出租车形成。
下车时绿色,上车是蓝色,总结了329次出租车形成,在接送街道:南山路,北山路,灵珠路,杨公提上显示街道名称和接送数量
南山路和北山路用来接送,下午北山路用于下车,另外在灵珠路的灵隐山有游客中心,很多人早上坐出租车到博物馆,因此早上安排在灵隐山的穿梭巴士

论文总结

这篇论文提出了一种新的分析轨迹数据的交互方式,不同于传统的时空刷选的方式,用户直接在文本框中输入查询条件就可以进行轨迹数据查询,降低了用户的学习成本。这个工作的核心是把轨迹数据转化成文本的形式,用适当的特征去描述轨迹,十分依赖文本化时提取的特征。

基于语义,基于语义,我想了一学期,询问了一些大佬关于这篇文章它的语义体现在哪里。后面学了一些知识后,才完整地感悟这篇文章为什么可以发TVCG,可以给小白一些参考,大佬勿喷。
最开始我一直以为基于语义的意思是用户输入了一些关键字,类似百度这种方式,系统后台去识别这些关键字,然后在数据库里面Search。这毫无创新点啊?后来看了一些资料。才发现重点内容是在数据本身的处理上,去挖掘数据不同属性,即不同维度的关系,这种关系即语义。
比如我用苹果手机,苹果手机的属性:价格7000块,正面黑色,背面黑色,正面底部home键,背面双摄像头。另外A品牌的手机:价格4000块,正面白色,背面黑色,正面底部无按键,背面四摄像头。这就是不同的东西拥有同样六维的属性。那么用户在搜索:背面黑色 这个关键字的时候,系统在索引里查找,找到背面黑色的东西,将背面黑色与苹果手机/A品牌手机之间的关系挖掘出来,即关联起来,这就是语义的体现。
那么这篇文章,在于非常多的出租车轨迹数据拥有相同的维度(属性),仅仅是属性的值不同,那么用户在搜索的时候,系统通过查找一些预定义的索引,来将用户需求和数据本身相连接,实现快速查找和数据挖掘,这就是基于语义的意义。
入坑初感,若有偏颇,请斧正。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值