VAUD:A Visual Analysis Approach for Exploring Spatio-Temporal Urban Data 探索时空城市数据的可视分析方法
下载地址 提取码:s1v4
- 问题:两个目击者报告犯罪嫌疑人在下午3点-3点20之间乘坐出租车转过南街和北街。警察想要找出可以出租车的路径。
- 途径:下午3点-3点20之间经过南街和北街的出租车的行程是什么样的,他们在那些街道停留,POI是哪些。
- 以前的系统:1、地图上选择北街周围的区域,2、选择时间段3点-3点20,3、过滤并选择在北街的所有GPS采样点,4、用上一步中选择的点显示同一辆出租车行程,5、重复以上步骤选择南街,6、找到这些出租车走过的其他街道。
- VAUD系统:帮助用户通过另外一种方式完成任务,就像用户使用google或者百度一样,在搜索引擎中填入关键字来查询。比如针对任务2,,警察输入:选择在3点-3点20之间,经过北街和南街所有的出租车。然后就在地图上显示所有符合条件的形成以及文本标签,并且通过简短的文本摘要,让警察立即找到所需求的街道的名称。
- 我们来看几个问题: 第一个问题是在你只知道你坐的出租车起点终点、时间的情况下,如何找到你在出租车上丢失的手机
第二个问题:如何精确的分析和推理城市的交通情况,而不是仅仅用堵或者不堵
第三个问题:如果你想要买房,如何在不了解实地情况下通过放假来比较人们的生活状态
- 浙大有一帮人,做了这么一个系统。有了这个系统,你只需要通过起点终点和时间就可以知道你手机遗落在哪辆出租车上
有了这个系统,一个不需要受过专业训练,比如懂SQL查询语句这种,的人,简单地使用what when where
taxi,来准确定位城市交通的拥堵情况 有了这个系统,在一个陌生的城市买房,通过房价
,可以轻松比较出高房价和低房价的人的生活状态的差距,选择最适合自己的房子。 - 那么问题来了,第一个,起点终点和时间与出租车状态是两个域,两个不同的数据集
第二个,城市交通是通过车子来反应的,如何使用时间,地点,来定位城市交通 第三个,房价和人的生活状态(POI)是两个域 - Visual Queries: fuses the knowledge from multiple data sources
- Visual Reasoning: Utilize the inter-connectedness among multiple
domains thus developing a visual analysis sys. - A new visual query model that enables cross-domain correlation &
deduction from multiple data sources. - A visual analytics framework that supports the visualization,
correlation, querying, & reasoning of citywide urban data for various
analysis tasks.
VAUD: 一个新的可视化查询模型,支持跨域管理和从多个数据源推断。 一个可视化分析框架,支持城市范围内的各种分析任务的可视化,关联,查询和推理。
作者所用的数据库:
- Geographical Data: A road network of the city
- POIs Data: e.g, shopping malls, restaurants
- Street View Data: Linked imagery of locations
- Real Estate Data: 5684 estate records, e.g, prices
- Mobile Phone Location Data: ID, time stamp
- Social Network Data: 27 million phone call records
- Microblog Data: Microblog website fall inside the city
- Taxi GPS Traj. Data: ID, GPS, speed
- Taxi Profile data: driver’s traffic records
ID属性:用户名,出租车ID,电话号码
空间属性:经度纬度,街道地址
时间属性:日期或者时间段
描述性属性:年龄,速度,方向
作者构建了一个STC:space time cube,基于时空的立方体
Xy轴是经纬度,Z轴是时间,
STC用给定的分辨率分成3D网格,如果记录的是时空信息,就可以用STC,如果是POI数据,就单独存在数据库中,并且在POI的空间属性上构建索引来实现快速查询
时空轨迹构建四叉树索引及STC模型,加速相同时空轨迹点的匹配,实现快速查询
如何查询:所有的查询份成原子表达式:查询条件,查询操作,查询结果,
原子查询可以以执行时间,空间,为条件,或者时空的交集并集差集
查询条件:时间,地点,内容
查询操作
想查询谁乘坐经过中心广场的出粗车
三个原子查询和三个提取
首先,查询which–》objectPOI
第二查询where and when --》objectCar
第三查询 where and when --》object Person
每次原子查询只能使用一个数据源,复杂的查询任务使用布尔组合(查询序列)
场景视图
A场景
B查询
C行动清单
D场景清单
E地理对象
F时间轴
B查询视图;用户交互,可以进行拖放来实现视觉推理
有了查询模型,就在查询界面中构建查询节点,使用拖拽,输入,选择的方式代替传统的SQL查询语句
使用拖拽,输入,选择的方式代替传统的SQL查询语句,为真个推理过程构建查询连。
可以显示详细的数据属性,用户自由抽取信息。
案例
分析师发现有人说他手机丢了,只有OD信息和实践
OD信息是SongTai 广场到百花园
实践是某一个时间,用户很肯定自己在出驻车上丢了手机
首先查询POI
第二部查询 出驻车的时间和位置
第三分析(警察做的事)
第四,这个地点和这个时间在这个出租车的轨迹和手机基站轨迹数据比较匹配找到num
总结
这篇论文呈现的VAUD系统运用场景非常多样化:为交通拥堵情况分析提供可视化的交互式分析辅助决策,如潮汐道路的路况分析,公共安全相关的人群聚集、疏散等,有助于公共资源的最大化灵活利用,保证整个城市的运行“健康”。
缺陷:数据隐私和数据的实时性