一. Characteristics of ST Data
时空数据,顾名思义其主要由时间维度和空间维度数据组成,数据呈现多面立体型。
首先,考虑在空间维度上有哪些特性值得我们思考???时间维度又有哪些特征是我们在考虑时序时必须考虑到的呢???
空间相关
1)spatial closeness
地理学第一定律:Everything is related, similar things are more closely related
2)spatial hierarchy
元素空间粒度不同,具有不同的空间结构层次——多层次性、多面性
3)spatial distance
描述空间对象物理距离
时间相关——时序的重要特性
1)Closeness
根据时间连续性,一般情况下,相邻时间的数据具有很强的相似性。其特征表示相近(you could see it after embedding)。
2)Periodicity
季节性:序列的平均值有规律的、周期性的变化,称时间序列表现出季节性。 季节性变化通常遵循时钟和日历——一般一天、一周或一年的重复。
3)Trend
趋势性:时序随时间变化整体呈现出的一种上升或下降趋势(在一定时间内单调)。
二. 时空(ST)大数据挖掘研究的一种可行paradigm:
时空大数据综合时、空领域内知识系统,结合AI,赋能智慧城市。
**主体意识:城市——时空场——数据生产者—— Different subjects correspond to different problems, corresponding to different models and data elements.
One possible analyzsis thought:
城市每天的生产生活活动都会产生海量的信息;根据任务场景的不同,选取需要的数据,进行清洗;又根据城市/社会模型以及所选数据的时空特性(不同领域的数据具有不同的特异属性--后续分享)综合建立所需的模型。
三. How to do it ?
Modeling pipeline of Spatio-Temporal AI
Step1.分析原生数据(Raw data):POI兴趣点,RN路网结构,Traj轨迹数据等。
Step2.(Dataset)转换Raw数据为更加适配神经网络模型的数据格式——转换合适数据类型:时空轨迹、时空格子数据、时空图数据、时空序列数据。
Step3.(Model selection and ST-AI model build)模型选择与搭建:(1)机器学习的方法;
(2)ST神经网络(优点):
2.1)相对之下有更大的容量,有利于时空模型的构建:Larger capacity;
2.2)自动特征提取Auto featre extraction;
2.3)考虑额外的外部因素,如天气和时间的影响friendly to cross-domain data fusion,e.g., considring external factors.
搭建模型的基础组件模块:
四. 下游任务:
时空数据挖掘的主要下游任务有:预测、异常检测、数据插补、推荐、任务规划、分类等。
在建模过程中,需要先明确任务目标,才能更好选择使用哪些理论和基础block,并设计合适的loss Function。
ST科研分享开端——认识时空场,发现运行规律
随着机器学习、深度学习的不断发展,时空分析领域不仅仅限于使用物联网传感器检测、运筹统计、GIS空间数据分析、地统计等方向,AI+X赋能众多“基科”,推动了全新的数据挖掘建模方式。
接下来本频道将交替更新time serise 、Spatiotemporal科研入门相关知识的讲解和论文讲解分享。从基础理论的角度出发,有侧重地讲述数据科学、网络科学以及AI赋能下的ST-BD。
期待有志同道合的博友一起学习交流 ^-^ !