KDD 2022时空数据挖掘领域论文汇总

        KDD 2022是数据挖掘领域的顶级学术会议,第28届会议于2022年8月14-18日在美国华盛顿特区会展中心举行。KDD 2022的Research和Applied Data Science两个Track共收到2448篇投稿,其中449篇被接收发表,总体接收率为18.3%。本文梳理汇总了发表于KDD 2022上的时空数据挖掘(Spatial-Temporal Data Mining)领域20篇论文(如有疏漏,敬请谅解)。

1. Robust Event Forecasting with Spatiotemporal Confounder Learning

作者:Songgaojun Deng, Huzefa Rangwala, Yue Ning

机构:斯蒂文斯理工学院、乔治梅森大学

一句话概括:本文引入了一种新的因果推理模型用于独立因果效应(Individual Treatment Effect)估计,模型通过捕获事件在不同位置的时空依赖性来学习隐藏混杂因素的表示。

论文简介:数据驱动的社会事件预测方法利用相关的历史信息预测未来的事件。这些方法依赖于历史标记数据,当数据有限或质量较差时,预测效果不佳。研究事件之间的因果关系不是进行相关性分析,而是挖掘事件之间潜在的因果关联,从而对事件进行更可靠的预测。然而,在数据驱动的事件预测中引入因果关系分析是具有挑战性的。第一个挑战是,事件发生在一个复杂和动态的社会环境中。许多未观察到的变量,即隐藏的混杂因素,会影响潜在的原因和结果。第二个挑战是,对于时空非独立同分布数据,建模隐藏混杂因素从而准确估计因果效应并非易事。在这项工作中,本文引入了一个深度学习框架,将因果效应估计集成到事件预测中。其首先研究了从具有时空属性的观测事件数据中估计独立因果效应(Individual Treatment Effect)的问题,并提出了一种新的因果推理模型来估计独立因果效应。然后,将学习到的事件因果信息作为先验知识融入到事件预测中。通过引入两个鲁棒性强的学习模块,包括特征加权模块和近似约束损失模块,事件预测模型实现了先验知识的注入。本文在公开事件数据集上评估了所提出的因果推理模型,并通过将学习到的因果信息输入到不同的深度学习方法,验证了所提出的鲁棒学习模块在事件预测中的有效性。实验结果证明了所提出的因果推理模型在社会事件的独立因果效应估计问题上的优势,并验证了鲁棒学习模块有助于社会事件预测。

3bbae02f77bf7e42c0f7a05163cbab17.png

2. Spatio-Temporal Trajectory Similarity Learning in Road Networks

作者:Ziquan Fang, Yuntao Du, Xinjun Zhu, Danlei Hu, Lu Chen,Yunjun Gao,Christian S. Jensen,

机构:浙江大学、奥尔堡大学

一句话概括:将轨迹匹配至路网后进行相似性计算,对轨迹的离散化建模更加精确;同时,计算轨迹相似度时,考虑了时间维度的相似性。

论文简介:轨迹的相似度计算是轨迹学习中的一个基本问题。作者发现:现有的轨迹相似度的计算和拟合方法都局限于空间维度,没有考虑轨迹在时间维度的相似性。此外,现有方法在建模空间相似度时,都没有考虑路网的约束。文章提出的ST2Vec模型定义轨迹嵌入向量的内积为轨迹间的相似度。在轨迹嵌入时,模型通过时间建模模块提取时间信息,基于包含GCN的空间建模模块提取路网上轨迹点的位置信息,并通过时空注意力融合模块提取时空交互信息,最终通过轨迹编码层获得轨迹的最终嵌入表示。为提高嵌入学习的收敛速度和训练效率,作者设计了一种基于课程学习(curriculum learning)的对比损失用于加速训练。模型在两个公开数据集上与先前的轨迹相似度计算模型进行对比实验,并提供了个案研究;实验结果证明了该模型具有更好的准确性、效率和鲁棒性。

9bd272f2f016c551f56f3312499f25bd.png

3. Mining Spatio-Temporal Relations via Self-Paced Graph Contrastive Learning

作者:Rongfan Li, Ting Zhong, Xinke Jiang, Goce Trajcevski, Jin Wu, Fan Zhou

机构:电子科技大学、爱荷华州立大学

一句话概括:提出了一种新的自适应图构造策略——自步调图对比学习(SPGCL),通过最大化正邻居和负邻居之间的区别来学习节点之间的关系,并使用自步调策略生成最优图,解决了预定义图不可用时,表示能力和预测结果受到限制的问题。

论文简介:在位置约束时间序列学习中,建模复杂的空间和时间依赖关系是必不可少的。现有的方法,主要依靠图神经网络(gnn)和基于递归神经网络的时间学习模块,已经取得了显著的性能改进。然而,当预定义图不可用时,它们的表示能力和预测结果受到限制。与专注于设计复杂架构的时空gnn不同,我们提出了一种新的自适应图构造策略:自步调图对比学习(SPGCL)。它通过最大化正邻居和负邻居之间的区别来学习节点之间的关系,并使用自步调策略生成最优图。具体而言,每一轮的每个邻域迭代吸收亲和度最高的可靠节点作为新的邻居节点,并通过数据增强的方式来提高可模型的转移性和鲁棒性。当自适应自步调图逼近优化图进行预测时,节点与对应邻居之间的互信息是最大化的。我们的工作为解决欧几里得空间信息聚合之外的时空学习问题提供了一个新的视角,并可推广到不同的任务。在两个典型的时空学习任务(交通预测和陆地位移预测)上进行的大量实验表明,SPGCL的性能优于最先进的技术。

51276aa9216799ba994908ce8fb5ca1f.png

4. MSDR: Multi-Step Dependency Relation Networks for Spatial Temporal Forecasting

作者:Dachuan Liu, Jin Wang, Shuo Shang, Peng Han

机构:电子科技大学、加利福尼亚大学洛杉矶分校、奥尔堡大学

一句话概括:提出了多步依赖关系(MSDR),通过显式地从多步的历史时间中提取长程依赖关系,能够捕获交通网络中复杂和长距离的时空依赖。

论文简介:提升智能交通系统服务质量的关键技术就是时空流量预测。由于交通网络中复杂且长期的时空依赖性,这项任务具有一定的挑战性。现有方法通常使用各种各样的深度神经网络来学习时间和空间的表示,以捕捉复杂和动态的依赖关系。从时间提取模块学习的隐式表示中捕获远程空间依赖关系是不充分的,为了解决这种不充分的问题,本文提出了多步依赖关系(MSDR),这是一种新的循环神经网络的变体。这种方法不仅仅关注最近一个时间步的隐藏状态,而是显式地将多个历史时间步作为每个时间单元的输入。与此同时,我们制定了两种策略来在多历史时间步和当前时间步之间将空间信息结合到依赖关系的嵌入。在此基础上,用一种基于图的MSDR框架(GMSDR)将图神经网络与MSDR无缝集成,以此来支持一般时空预测的应用。本文提出的模型在多个常见的时空数据集上的表现较如今流行的方法均得到了提升。

ac3f4b05c32acf916bee6a8ef2712720.png

5. Spatio-Temporal Graph Few-Shot Learning with Cross-City Knowledge Transfer

作者Bin Lu, Xiaoying Gan, Weinan Zhang, Huaxiu Yao, Luoyi Fu, Xinbing Wang

机构上海交通大学,斯坦福大学

一句话概括提出一种模型无关的时空图学习框架,以应对跨城市知识迁移中不同城市时空图的结构和特征的差异性带来的挑战,可用于解决目标城市的小样本时空图学习问题。

论文简介时空图学习是交通流量、出租车需求、空气质量预测等城市计算任务的关键方法。由于数据收集成本很高,一些发展中的城市几乎没有可用的数据,这使得训练一个性能良好的模型不可行。为了应对这一挑战,跨城市知识转移具有很广阔的应用前景,即利用从数据充足的城市中学到的模型来辅助数据稀疏的城市的模型学习。然而,不同城市之间的时空图呈现出不规则的结构和不同的特征,从而限制了现有的小样本学习方法的可行性。因此,我们提出了一种模型无关的时空图小样本学习框架,称为ST-GFSL。具体而言,为了通过迁移跨城市知识来增强特征提取,ST-GFSL提出基于节点级元知识生成非共享参数。目标城市中的节点通过参数匹配传递知识,从相似的时空特征中进行检索。此外,我们提出在元学习过程中重构图的结构。定义了图重构损失,来指导结构感知学习,避免了不同数据集之间的结构偏差。我们在四个交通速度预测基准测试上进行了全面的实验,结果证明了与最先进的方法相比,ST-GFSL具有有效性。

821b0ea5a024286faef2ec1abdd53b14.jpeg

6. Pre-training Enhanced Spatial-temporal Graph Neural Network for Multivariate Time Series Forecasting

作者:Zezhi Shao, Zhao Zhang, Fei Wang, Yongjun Xu

机构:中国科学院大学

一句话概括:本文提出了一种预训练框架以有效地从长期历史时间序列中学习时间模式,并生成片段级的表示,以增强时空图神经网络,实现准确的多元时间序列预测。

论文简介:多元时间序列 (MTS) 预测在众多应用中起着至关重要的作用。近年来,时空图神经网络 (Spatial-Temporal Graph Neural Networks, STGNNs) 已成为越来越受欢迎的MTS预测方法。STGNN通过图神经网络和时序模型联合建模MTS的时空模式,显著提高了预测 MTS 的精度。但受模型复杂性的限制,大多数STGNN模型只考虑短期的MTS历史数据,如过去一小时的数据。然而,时间序列的模式和空间之间的依赖关系需要基于长期历史的MTS数据进行分析。为了解决这个问题,本文提出了一种新的框架,其中STGNN被一个可扩展的预训练时间序列框架(STEP)所增强。具体来说,本文设计了一个预训练模型,以有效地从长期历史时间序列(例如,过去两周)学习时间模式,并生成片段级的表示。这些片段级表示为输入STGNN中当前片段短期时间序列提供上下文信息,并促进时间序列之间的建模依赖性。在三个公开的真实数据集上的实验表明,本文的框架能够显著增强下游的STGNN,并且本文的预训练模型充分捕捉了长时时间模式和空间依赖关系。

e1190104b0e16dac0d61b79293f64b39.png

7. Beyond Point Prediction: Capturing Zero-Inflated & Heavy-Tailed Spatiotemporal Data with Deep Extreme Mixture Models

作者Tyler Wilson, Andrew McDonald, Asadullah Hill Galib, Pang-Ning Tan, Lifeng Luo

机构密歇根州立大学

一句话概括提出Deep Extreme Mixture Model (DEMM),该模型融合了基于深度学习的门槛模型和极值理论,实现了具有零膨胀,重尾分布特性的时空变量的点和分布预测。

论文简介零膨胀、重尾时空数据在科学和工程领域很常见,涵盖很广,从气候科学到气象学和地震学。在这种情况下的一个主要建模目标是预测极端和非极端事件的强度、频率和时间。然而,在深度学习背景下,实现这个目标需要解决一些关键挑战。首先,应用于此类数据的深度学习框架必须统一描述零事件、中等事件和极端事件的混合分布。其次,该框架需要在混合分布的每个组成成分中实现对参数的约束。最后,该框架必须足够灵活,以适应训练后用于定义极端事件的阈值发生的变化。为解决这些挑战,本文提出Deep Extreme Mixture Model (DEMM),该模型融合了基于深度学习的门槛模型和极值理论,实现了具有零膨胀,重尾分布特性的时空变量的点估计和分布预测。该框架可以在推理时动态设置定义极端事件的阈值,而不需要重新训练模型。我们做了大量的实验,将DEMM应用于降水量预测,并观察到该模型在点估计和分布预测任务中实现了显著的效果提升。

c7aaf04e2abc14d56a14f35eb33e2a4e.png

8. MetaPTP: An Adaptive Meta-optimized Model for Personalized Spatial Trajectory Prediction

作者Yuan Xu, Jiajie Xu, Jing Zhao, Kai Zheng, An Liu, Lei Zhao, Xiaofang Zhou

机构苏州大学、香港科技大学

一句话概括:提出了一种用户个性化轨迹预测的元学习方法MetaPTP,建模了用户的相似度,并且能够处理用户冷启动以及用户-轨迹冷启动问题。

论文简介:本文提出了一种元学习方法MetaPTP用于解决个性化的轨迹预测问题。为了解决用户冷启动以及用户-轨迹冷启动问题,文章采用基于软聚类的方法,根据用户的空间分布情况将具有相似出行偏好的用户分组到同一个类别中,以便更好地在相似用户之间传递共享知识。本文设计了一个用户类别维度的参数存储器,可以根据用户的偏好在初始化阶段提供偏向于用户的网络参数。为了进行个性化推荐,引入一种融合用户偏好以及空间相关的轨迹采样方法生成有意义的支持集和一个自适应的权重生成器,为支持集中的不同轨迹样本自适应地分配权重。最后在北京和波尔图数据集上进行了大量实验说明了其有效性。

177c57823da020546d04729e177abad4.png

9. Characterizing Covid Waves via Spatio-Temporal Decomposition

作者Kevin Quinn, Evimaria Terzi, Mark Crovella

机构波士顿大学

一句话概括:提出了一种考虑空间结构的矩阵分解方法,并展示了如何使用迭代式方法进行构建,针对疾病或者大流行数据能够识别不同的时间传播模式(waves)以及空间中心。

论文简介在本文中,我们开发了一个框架来分析疾病或流行病(例如Covid)的模式。给定一个记录有关疾病在一组位置上传播信息的数据集,我们考虑识别疾病的时间传播模式(waves)以及空间上中心位置(epicenters)的问题。为此我们引入了一种新的时空分解方法,称之为扩散NMF (d-NMF)。在经典矩阵分解方法的基础上,d-NMF考虑了数据中位置(特征)的空间结构,并提出空间上靠近的位置更有可能经历相同时间模式传播的想法。为了阐述 d-NMF 的效果,我们分析了各种空间粒度的Covid病例数据。我们的结果表明,d-NMF在分解流行病的时间传播模式和识别每一次传播时的空间中心位置是有用的。

10. Service Time Prediction for Delivery Tasks via Spatial Meta-Learning

作者Sijie Ruan, Cheng Long, Zhipeng Ma, Jie Bao, Tianfu He, Ruiyuan Li, Yiheng Chen, Shengnan Wu, Yu Zheng

机构北京理工大学、京东、新加坡南洋理工大学

一句话概括提出结合元学习的服务时间预测模型MetaSTP,其特色在于建模了单元级、楼层级细粒度特征,以及使用元学习增强了地点级先验知识。

论文简介服务时间是“最后一公里派送”的时间成本中的一部分,即在特定地点交付包裹所花费的时间。预测服务时间是许多末端物流应用的基础,例如,具有时间窗口的路线规划、快递员工作量平衡和交付时间预测。然而,复杂的交付环境、位置异质性给准确预测带来了巨大挑战。现有解决方案基于监督模型,将要交付的包裹中提取的聚合特征用于训练,但这些方案无法很好地处理上述挑战。在本文中,作者们提出了一种基于元学习的神经网络模型MetaSTP来预测服务时间。MetaSTP将每个地点的服务时间预测视为一项学习任务,利用基于Transformer的表示层对复杂的交付环境进行编码,并设计了一种基于模型的元学习方法,该方法通过地点先验知识增强,以保留每个地点的唯一性并处理不平衡分布问题。实验表明,在两个真实数据集上,MetaSTP至少比基线高出9.5%和7.6%。最后,在京东物流内部部署并使用了基于MetaSTP的智能运单分配系统。

024a2be3917541940a441709ed1d54b6.png

11. Graph2Route: A Dynamic Spatial-Temporal Graph Neural Network for Pick-up and Delivery Route Prediction

作者Haomin Wen, Youfang Lin, Xiaowei Mao, Fan Wu, Yiji Zhao, Haochen Wang, Jianbin Zheng, Lixia Wu, Haoyuan Hu, Huaiyu Wan

机构北京交通大学、菜鸟网络

一句话概括提出一种基于动态时空图神经网络的揽派路径预测模型Graph2Route,首次将揽派路线预测问题建模成为图上的预测问题。

论文简介:本文研究城市末端揽派中顺序预测问题。顺序预测是末端揽派中的基础能力,服务于多个下游任务(如派单、时效预测等),由于实操中快递员的实际路线与计划路线之间存在很大的偏差,因此需要持续优化顺序预测的准确性。本文首次从图的角度描述PDRP任务(Pick-up and Delivery Route Prediction task),并提出一个基于“动态时空图”的模型——Graph2Route,Graph2Route首先利用一个动态ST-Graph编码器来充分捕捉不同任务的时空相关性和决策环境的演变,并在解码过程中利用了底层图的结构,得到合理的解码路线。最后,以快递寄件和外卖配送的真实数据为例进行实验,证明模型的有效性。

67125bdd52b7ccc830726914a472172c.png

12. Spatio-Temporal Vehicle Trajectory Recovery on Road Network Based on Traffic Camera Video Data

作者Fudan Yu, Wenxuan Ao, Huan Yan, Guozhen Zhang, Wei Wu, Yong Li

机构清华大学、商汤科技

一句话概括:结合交通摄像头视频数据,提出了一种迭代的框架,用于解决交通路口级别的所有车辆轨迹恢复任务。

论文简介:大量车辆轨迹的产生为分析城市交通带来了巨大的便利,可推动智慧交通系统的构建,服务于很多应用。由于传统方法只基于部分轨迹数据,它们无法恢复道路上所有车辆的轨迹。为了解决这个问题,我们研究了基于交通摄像头视频数据的所有车辆轨迹恢复。然而,这项研究存在两个挑战。首先,交通摄像头拍摄的图像质量不平衡,因此很难识别相同的车辆。其次,由于交通摄像头的不完整和交通摄像头可能漏掉车辆,交通摄像头观测数据稀疏。为了应对这些挑战,我们设计了一种新颖的系统来恢复具有道路交叉口粒度的车辆轨迹。在这个系统中,我们提出了一个迭代框架来联合优化车辆重识别和轨迹恢复任务。在车辆重识别任务中,我们提出了一种有效的策略来指导基于视觉特征和轨迹发现任务更新的时空约束特征的车辆聚类。在轨迹恢复任务中,我们通过概率方法对空间和时间关系以及车辆未命中问题进行建模以恢复轨迹。大量实验表明,我们的框架优于现有的最先进的解决方案。最后,我们的系统在中国商汤科技的实际应用中进行了部署,包括交通拥堵分析和交通信号控制。

4c7e1b96560c75bee4db2eef5c1c63c6.png

13. Uncertainty Quantification of Sparse Travel Demand Prediction with Spatial-Temporal Graph Neural Networks

作者Dingyi Zhuang, Shenhao Wang, Haris N. Koutsopoulos, Jinhua Zhao

机构麻省理工学院、佛罗里达大学、东北大学

一句话概括:本文设计了一个时空零膨胀负二项图神经网络(STZINB-GNN)量化稀疏出行需求的不确定性,可以有效解决稀疏区域的OD出行预测问题。

论文简介:起止点(Origin-Destination,OD)出行需求预测是交通领域一大挑战,近年来时空深度学习模型在该任务上取得了很好的效果。但是这些工作都忽略了O-D的不确定性和稀疏性。由于稀疏性产生了大量的0不符合了确定性深度学习的高斯假设,这样会导致预测严重偏离真实情况。针对这一问题,作者设计了一个时空零膨胀负二项图神经网络(STZINB-GNN)来量化稀疏出行需求的不确定性。该模型利用扩散图卷积(DGCN)和时间卷积(TCN)提取时空相关性,并利用专门的参数П针对稀疏性问题学习零膨胀。然后将融合的时空相关性以参数化出行需求的概率分布。在两个真实世界的数据集上进行实验,STZINB-GNN优于基准模型,尤其是在细粒度的时空下,有着高精度、紧密的置信区间和可解释的参数。其中针对稀疏性的参数Π能在各种交通场景下提供合理的物理解释。

8ee662f751eab1a3ecb226805a6df013.png

14. Activity Trajectory Generation via Modeling Spatiotemporal Dynamics

作者Yuan Yuan, Jingtao Ding, Huandong Wang, Depeng Jin, Yong Li

机构清华大学

一句话概括提出新颖的基于生成对抗模仿学习的框架,能够生成真实性和实用性更强的用户轨迹,提升人造数据在现实中的可用性。

论文简介人类日常活动,例如工作、外出就餐和旅行,在密接追踪和 COVID-19 传播模式建模中发挥着重要作用。然而,出于隐私和商业方面的顾虑,从真实场景中收集的个人活动数据非常有限。在本文中,作者提出了一个基于生成对抗模仿学习的新框架,以生成具备真实性和实用性的人造活动轨迹。为了应对不规则采样活动固有的随机性和稀疏性,作者创新地利用神经微分方程,捕捉轨迹背后的时空动态性。作者在时间演化和空间转换中,结合了连续活动之间的连续流动动态,以及观测活动点的瞬时更新。在两个真实世界数据集上的实验表明,本文提出的框架在实际应用中,相较于目前最优的基线,能够提升数据的真实性和实用性。此外,作者使用合成数据建模 COVID-19 传播模式,与基线相比, MAPE 的结果降低了 50% 以上。

bae91f148a10f6893c392520e7d5fd06.png

15. Selective Cross-City Transfer Learning for Traffic Prediction via Source City Region Re-Weighting

作者Yilun Jin, Kai Chen, Qiang Yang

机构香港科技大学

一句话概括针对跨城市迁移学习时使用源城市数据训练模型可能带来的负面因素,提出一种选择性迁移学习框架,通过源城市区域重加权方式来协助目标城市的微调,以应用于交通预测任务。

论文简介:深度学习模型已被证明可以有效建模复杂的时空数据并实现准确的交通数据预测。在实践中,训练基于深度学习的交通预测模型依赖于大规模的交通数据,而现实场景中积累的数据可能无法满足这一需求。为了应对数据稀缺问题,一种有前景的解决方案是使用跨城市迁移学习技术,微调从源城市充足数据中训练好的模型。但是,现有方法忽略了源城市和目标城市之间的差异,因此,来自源城市的训练好的模型可能包含噪声甚至有害的源知识。为了解决该问题,我们提出了CrossTReS,这是一个用于交通预测的选择性迁移学习框架,可自适应地重加权源区域来为目标微调提供协助。作为一种基于微调的跨城市迁移学习的通用框架,CrossTReS由特征网络、加权网络和预测模型组成。我们用节点和边级的域自适应技术来训练特征网络,以学习源和目标城市的通用空间特征。我们通过源-目标联合元学习进一步训练加权网络,以使有助于目标微调的源区域被分配高权重。最后,利用学习到的权重在源城市上对预测模型进行选择性训练,以初始化目标微调。我们使用真实的出租车和自行车数据评估了CrossTReS,在相同的设置下,CrossTReS的表现优于最先进的基线高达8%。此外,所获的区域权重提供了可解释的可视化。

fe600f5d606e05a8cddb649c6c502d4f.jpeg

16. Modeling Network-level Traffic Flow Transitions on Sparse Data

作者:Xiaoliang Lei,Hao Mei,Bin Shi,Hua Wei

机构:西安交通大学、新泽西理工学院

一句话概括以新颖的“交通操作”视角对交通系统的变化进行抽象,并基于此建模交通状态变化过程,在稀疏的数据上也能得到高准确性的交通状态预测。

论文简介:在城市环境中,对交通网络中的流量变化进行建模对于许多交通领域的应用非常有用,包括交通运输决策、公众安全和城市规划等。交通流量的变化可以被视为交通状态(例如,每个路段上的交通容量)随时间互相间转换的动态过程。在现实中,交通系统若具有交通信号控制,或者可逆车道变换等交通操作,那么其交通状态会受到历史状态和交通操作的影响。在这篇文章中,作者考虑了在现实环境下对交通网络流量进行建模的问题,其中可用数据是稀疏的(即仅对交通系统的一部分进行监控)。作者提出了 DTIGNN 模型,一种可以用稀疏数据进行交通网络流量预测的方法。DTIGNN 将交通系统建模为受交通信号影响的动态网络,学习状态转移模型,并通过插补来预测未来交通状态。经过全面的实验证明,本文提出的方法优于目前最先进的方法,并且可以更好地支持交通决策。

df3756b82cbbfa26435246e85295cbbc.png

17. Learning to Discover Causes of Traffic Congestion with Limited Labeled Data

作者Mudan Wang, Huan Yan, Hongjie Sui, Fan Zuo, Yue Liu, Yong Li

机构清华大学

一句话概括:用有标签的数据来训练一个拥塞特征抽取的模型,之后用该模型对未知和已知的交通路况抽取特征,然后使用聚类的方法,给出拥塞原因。

论文简介:交通拥堵导致出行时间延误,严重影响我们的日常出行体验。探索交通拥堵的原因对于有效解决交通拥堵问题、提升用户体验具有重要意义。挖掘拥堵原因的传统方法依赖于人力,这既费时又费钱。因此,我们的目标是以系统的方式发现交通拥堵的已知和未知原因。然而,要实现它,面临三个挑战:1)交通拥堵受多种因素影响,时空关系复杂;2)由于人为标签的限制,已知原因的拥塞数据量较少;3) 存在多种因素会导致交通拥堵,更多未知的拥堵原因尚未探索。针对上述挑战,我们设计了一个拥塞原因发现系统,由两个模块组成:1)拥塞特征提取,提取影响拥塞的重要特征;2)拥堵原因发现,它利用基于深度半监督学习的方法通过有限标签数据来发现交通拥堵原因。具体来说,它首先利用一些标记数据作为先验知识来预训练模型。然后,在数据重构损失和KL散度损失的监督下,执行深度嵌入聚类方法生成聚类。大量实验表明,我们提出的方法的性能优于基线。此外,我们的系统已在高德的实际生产环境中部署和使用。

caf65c483c2e97ef55f24c3b317ecf64.png

18. Continuous-Time and Multi-Level Graph Representation Learning for Origin-Destination Demand Prediction

作者:Liangzhe Han, Xiaojian Ma, Leilei Sun, Bowen Du, Yanjie Fu, Weifeng Lv, Hui Xiong

机构:北京航空航天大学、中佛罗里达大学、香港科技大学

一句话概括:该模型对于每个交通节点维护一个动态状态向量来表示历史信息并持续进行动态更新,并将交通节点与集群级别和区域级别的虚拟节点进行融合。

论文简介:近些年基于深度神经网络的交通需求预测引起了学术界和工业界广泛的关注。其中,对于出发地-目的地(OD)的需求预测仍然是一个有价值并且具有挑战性的问题。主要存在以下几个难点:(1)庞大的OD对数量(2)隐藏的空间相关性(3)复杂的交通状态。为了解决上述问题,本文提出了一种用于出发地-目的地的需求预测(CMOD)的连续时间多级动态图表示学习方法。首先,构建了一个连续时间动态图表示学习框架,该框架为每个交通节点(地铁站或出租车区域)维护一个动态状态向量,状态向量用于表示历史信息,并根据最近发生的需求来不断进行更新。其次,提出了一种多级结构学习模块,用于建模不同节点之间的空间相关性,不仅可以从数据中自适应地学习节点之间的关系,还可以学习集群级和区域级的虚拟节点之间的关系。最后,设计了一个跨层融合模块,用于融合节点与集群级和区域级虚拟节点之间的关系,得到用于最终预测的节点表示。最后,在来自北京地铁和纽约出租车的两个真实数据集上进行了大量实验,证明了模型相对于现有方法的先进性。

129642fb495fa30d93f2c4ecd0b79b2d.png

19. Applying Deep Learning Based Probabilistic Forecasting to Food Preparation Time for On-Demand Delivery Service

作者Chengliang Gao, Fan Zhang, Yue Zhou, Ronggen Feng, Qiang Ru, Kaigui Bian, Renqing He, Zhizhao Sun

机构美团

一句话概括将食物准备时间的预测建模成概率预测问题,即预测标签是概率分布而非准确值,提出了基于深度学习的非参数化方法和新的损失优化S-Quantile Loss。

论文简介外卖平台的食物准备时间(Food Preparation Time,FPT)对消费者和外卖员都很重要,但实际应用时,准确预测FPT面临两个主要挑战:(1)数据标签不足,(2)FPT数据存在巨大的不确定性。文章采用了概率预测(Probabilistic Forecasting,PF),提出了一个基于深度学习的非参数化方法来预测FPT。对于一些没有明确标签的数据,在特征提取和模型构建过程充分利用这类数据的上下界,而数据的不确定性会影响结果的确定性预测,因此采用概率预测方法预测FPT的概率分布而不是准确的值。S-CRPS损失经常用于概率预测问题,并且比MLE损失更具鲁棒性,文章提出了S-Quantile损失(S-QL)并用于模型优化,并证明了S-CRPS与其在区间删失数据(interval-censored data)上的关系。实验在离线数据以及在线A/B测试都证明了提出方法的有效性。

c9da9ec753d75a743e0dd56c6d8d5a8f.png

20. Para-Pred: Addressing Heterogeneity for City-Wide Indoor Status Estimation in On-Demand Delivery

作者:Wei Liu, Yi Ding, Shuai Wang, Yu Yang, Desheng Zhang

机构:东南大学

一句话概括提出一种基于图神经网络的室内状态估计模型ParaPred,重点应对大规模场景(上万商家,数百设备)下的设备异质性和环境异质性挑战。

论文简介即时配送是近年来一种新兴的物流形式。客户在平台下单后,平台安排配送员在短时间内将客户指定商品进行派送。对于配送平台来说,估计配送员室内状态(即到达或离开商户)在订单调度和路线规划中发挥着重要作用。当前,低功耗蓝牙设备(Bluetooth Low Energy, BLE)由于其较低的硬件成本、部署成本和低功耗等优点,是解决室内状态预测一种有前景的方案。然而,环境异质性和智能设备的异质性会使得状态预估表现下降。以前建模以上异质性的方法不适用于城市大规模场景(成千上万的商家和数百款智能手机)下的室内状态估计。本文设计了Para Pred,利用蓝牙信号异质性之间的相似性构图并基于图神经网络,对于没见过的场景直接预测有效的室内状态估计模型参数进而完成更精准的室内状态估计。

16e1f05661396c059b89225807f77363.png

转:时空数据学习

推荐阅读:
我的2022届互联网校招分享

我的2021总结

虽迟但到,我的2022年总结
浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总
公众号:AI蜗牛车

保持谦逊、保持自律、保持进步

发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)
发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书
EIS 环境下的数据挖掘技术的研究.caj FCC油品质量指标智能监测系统的数据挖掘与修正技术.caj IDSS 中数据仓库和数据挖掘的研究与实现.caj InternetWeb数据挖掘研究现状及最新进展.caj Internet数据挖掘原理及实现.caj Min-Max模糊神经网络的应用研究.pdf OLAP与数据挖掘一体化模型的分析与讨论.caj OLAP和数据挖掘技术在Web日志上的应用.caj ON-LINE REDUCING MACHINING ERRORS IN BORING OPERATIONBY FORECASTING COMPENSATORY CONTROL TECHNIQUE.pdf SDSS中空间数据挖掘部件的设计与实现.kdh swlms.pdf Web上的数据挖掘技术和工具设计.kdh Web使用模式研究中的数据挖掘.caj Web数据挖掘技术及工具研究.kdh Web数据挖掘技术探讨.kdh Web数据挖掘的BN实现方案.kdh XML与面向Web的数据挖掘技术.caj 一个新的数据挖掘模型与算法.caj 一个面向电子商务的数据挖掘系统的设计与实现.caj 一种估计人工神经网络泛化误差的新方法.pdf 一种基于数据仓库的数据挖掘系统的结构框架.caj 一种基于神经网络的数据挖掘方法.caj 一种基于遗传算法的模糊神经网络最优控制.pdf 一种实时过程控制中的数据挖掘算法研究.caj 一种建立模糊模型的粗糙集方法.pdf 一种新型数据分析技术——数据挖掘.caj 一种新的高效关联规则数据挖掘算法.caj 一种有效的用于数据挖掘的动态概念聚类算法.caj 一种测试数据挖掘算法的数据源生成方法.caj 一种自适应模糊控制器.pdf 一类递归RBF神经网络模型的稳定性讨论.pdf 不确定性线性系统模型处理的一种新方法.pdf 中介粗集及其在数据挖掘中的应用.caj 二进神经网络隐元数目最小上界研究.pdf 以地物识别和分类为目标的高光谱数据挖掘.caj 信息技术在全球银行业的应用(六)——数据挖掘技术及其应用.kdh 信息技术在全球银行业的应用(六)——数据挖掘技术及其应用1.kdh 信息检索中的数据挖掘技术.caj 信息系统中一种面向粗糙集的数据挖掘方法.caj 全连接回归神经网络的稳定性分析.pdf 关注政府上网后的数据挖掘.kdh 决策支持分析新技术——数据挖掘.caj 分类特征规则的数据挖掘技术.caj 利用决策树进行数据挖掘中的信息熵计算.caj 利用模糊神经网络进行数据挖掘的一种算法.caj 前向网络bp算法在数据挖掘中的运用.caj 区间值属性不完全信息下的数据挖掘.caj 可视化数据挖掘技术及其应用.caj 在IDS中利用数据挖掘技术提取用户行为特征.caj 基于CORBA的数据挖掘工具KDD-DC.caj 基于Web的数据仓库与数据挖掘技术.caj 基于Web的数据挖掘技术及访问路径模式的研究.caj 基于XML的WEB数据挖掘技术.kdh 基于中心流形定理的永磁同步电动机模型的分支分析.pdf 基于云模型的Web日志数据挖掘技术.caj 基于代理的分布式数据挖掘系统设计.caj 基于信息熵的地学空间数据挖掘模型.caj 基于关联规则的舰艇故障诊断数据挖掘系统结构框架.caj 基于增强型算法并能自动生成规则的模糊神经网络控制器.pdf 基于多媒体数据库的数据挖掘系统原型.caj 基于小波理论的数据挖掘方法研究.caj 基于属性分类的数据挖掘方法.caj 基于改进Elman网的非线性系统的自适应建模与预估.pdf 基于数据抽取器实现数据挖掘.caj 基于数据挖掘建立动态人事管理决策系统.kdh 基于数据挖掘建立高校系科办学评估体系的合理性评价系统.caj 基于数据挖掘技术的抽油机泵参调整DSS决策支持系统.caj 基于数据挖掘方法的电子邮件过滤.caj 基于数据挖掘模型的高压输电线系统故障诊断.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于数据挖掘的普通话韵律规则学习.caj 基于数据挖掘的智能化入侵检测系统.caj 基于数据挖掘的深部采场岩爆知识的自动获取.caj 基于数据挖掘的知识发现在MDSS中的应用研究.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现1.caj 基于数据挖掘的群决策模型.caj 基于智能化数据挖掘的高新技术监测分析技术研究.caj 基于模糊对向神经网络的非线性动态系统辨识器.pdf 基于模糊规则的非线性系统建模方法.pdf 基于模糊逻辑的一类非线性系统直接自适应控制.pdf 基于相联规则的数据挖掘理论.caj 基于知识应用的数据挖掘技术理论分析与应用研究.caj 基于神经网络的多模态控制器设计.pdf 基于神经网络的非线性Smith预估器.pdf 基于粗糙集(Rough set)的数据挖掘及其实现.caj 基于粗糙集理论的数据挖掘模型.caj 基于粗糙集理论的数据挖掘的应用.caj 基于粗糙集理论的数据挖掘算法及其应用研究.kdh 基于粗糙集理论的数据挖掘算法研究.caj 基于系统补偿和遗传算法的动态测量方法.pdf 基于约束的多维数据挖掘技术.caj 基于遗传算法和受控随机搜索的系统优化策略.pdf 基于高校人事信息库的数据挖掘研究.caj 多媒体数据挖掘的相关媒体特征库方法.caj 多段支持度数据挖掘算法研究.caj 工业控制计算机的发展与前景.pdf 带Rough算子的决策规则及数据挖掘中的软计算.caj 异步电机定子电流的内模自适应控制及实现.pdf 感应电机磁场定向变结构型模糊变频调速系统的分析与设计.pdf 挖掘.com公司──数据挖掘技术和.com公司.caj 挖掘转移规则一种新的数据挖掘技术.caj 探索式数据挖掘模型的讨论.caj 控制系统多媒体仿真软件的研制.pdf 搭建基于数据挖掘技术的邮政物流信息平台.kdh 支持向量机多专家决策算法.pdf 改进型B样条模糊神经网络.pdf 数据仓库、数据挖掘在银行中的应用.caj 数据仓库、数据集市和数据挖掘.caj 数据仓库与数据挖掘.caj 数据仓库与数据挖掘1.caj 数据仓库与数据挖掘12.caj 数据仓库与数据挖掘技术及其在科技情报业的应用前景.caj 数据仓库与数据挖掘技术在电力系统中的应用.caj 数据仓库与数据挖掘技术浅谈.caj 数据仓库和数据挖掘技术在ERP中的应用.kdh 数据仓库的建设与数据挖掘技术浅析.caj 数据仓库的建设与数据挖掘技术浅析1.caj 数据挖掘 企业决策分析的有效工具.caj 数据挖掘——技术与应用综述.caj 数据挖掘、OLAP在决策支持系统中的应用.caj 数据挖掘与决策支持系统.caj 数据挖掘与决策支持系统的关系.caj 数据挖掘与数据库知识发现.caj 数据挖掘与电力系统 12.caj 数据挖掘与电力系统.caj 数据挖掘与电力系统1.caj 数据挖掘与虚拟数据库.caj 数据挖掘中Fuzzy c-means的自适应聚类算法.caj 数据挖掘中信息颗粒及其构造.caj 数据挖掘中决策树算法的探讨.caj 数据挖掘中概念树的标准、生成和实现.kdh 数据挖掘中知识管理与表达系统的设计与实现.caj 数据挖掘中聚类算法比较研究.caj 数据挖掘分类问题的贪婪粗糙集约简算法.caj 数据挖掘原理、方法及其应用.caj 数据挖掘及其在 SXWG_EIS 中的应用.caj 数据挖掘及其在商业银行中的应用.caj 数据挖掘及其在电力系统中的应用.kdh 数据挖掘及其在电力系统中的应用1.kdh 数据挖掘及其在通信侦察信号处理中的应用.caj 数据挖掘及其对统计学的挑战.caj 数据挖掘及其工具的选择.caj 数据挖掘及在营销中的应用.caj 数据挖掘和数据仓库及其在电信业中的应用.caj 数据挖掘和知识发现的技术方法.caj 数据挖掘在Internet信息导航系统中的应用研究.caj 数据挖掘在包装产品网络营销中的应用.caj 数据挖掘在音高变化规律学习中的应用.caj 数据挖掘工具DMTools的设计与实现.caj 数据挖掘工具和应用中的问题.caj 数据挖掘技术.caj 数据挖掘技术1.caj 数据挖掘技术12.caj 数据挖掘技术123.caj 数据挖掘技术与中国商业银行业务发展策略.caj 数据挖掘技术初探.caj 数据挖掘技术及其在地学中的应用.caj 数据挖掘技术及其在电力系统中的应用.caj 数据挖掘技术及其在电力系统中的应用1.caj 数据挖掘技术及其在营销中的应用.caj 数据挖掘技术及其实现.caj 数据挖掘技术及其应用.caj 数据挖掘技术及其应用1.caj 数据挖掘技术及其应用123.caj 数据挖掘技术及在电子商务中的应用.caj 数据挖掘技术在UNIX系统性能分析中的应用.caj 数据挖掘技术在Web上的应用及其工具设计.caj 数据挖掘技术在Web预取中的应用研究.caj 数据挖掘技术在入侵检测系统中的应用.kdh 数据挖掘技术在农业数据中的有效应用.kdh 数据挖掘技术在建模、优化和故障诊断中的应用.caj 数据挖掘技术在煤与瓦斯突出预测中的应用研究.caj 数据挖掘技术在税务系统中的应用.caj 数据挖掘技术在网络广告定制中的应用.kdh 数据挖掘技术在财经领域的应用.caj 数据挖掘技术应用研究.kdh 数据挖掘技术的一个应用模型.caj 数据挖掘技术的主要方法及其发展方向.caj 数据挖掘数据仓库构架的拓展.caj 数据挖掘方法的研究.caj 数据挖掘方法的评述.caj 数据挖掘的软分类方法.caj 数据挖掘管理系统.caj 数据挖掘系统的一种实现策略.caj 数据挖掘系统设计.caj 文本挖掘、数据挖掘和知识管理——二十一世纪的智能信息处理.caj 文本数据的数据挖掘算法.caj 新的鲁棒推理控制系统设计方法.pdf 无换向器电动机在窑尾排风上的应用.pdf 最优加权系数的神经优化方法.pdf 格子机数据挖掘方法.caj 模糊控制在现场总线控制系统中的应用.pdf 模糊控制系统近年来的研究与发展.pdf 模糊数据挖掘.caj 模糊聚类辨识算法.pdf 模糊逻辑系统的GA+BP混合学习算法.pdf 浅说数据挖掘.caj 混沌神经网络及其在最优化问题中的应用.pdf 特种电动机高压阀门准确制动的仿真计算.pdf 现场智能控制装置的研究与开发.pdf 用PID梯度算法训练基于神经网络的广义非线性PID控制器.pdf 用SQL Server2000构建数据挖掘解决方案.caj 用于建模、优化、故障诊断的数据挖掘技术.caj 用于数据挖掘的贝叶斯网络.caj 用于电子商务中的数据挖掘技术研究.caj 用户访问模式数据挖掘的模型与算法研究.caj 用数据挖掘技术优选侧钻井井位.caj 电信网告警数据库中的数据挖掘.caj 电子商务与Web数据挖掘.caj 目前数据挖掘算法的评价.caj 相关案件的数据挖掘.caj 知识发现与数据挖掘.caj 知识发现和数据挖掘的研究.caj 神经网络专家系统及其数据挖掘技术的探讨.caj 神经网络分类器的特征提取和优选.pdf 神经网络在数据挖掘中的应用研究.caj 神经网络数据挖掘方法中的数据准备问题.kdh 空间数据挖掘技术.caj 空间数据挖掘理论与方法的研究.caj 粗集数据挖掘方法MIE-RS的设计与实现.caj 红外光谱谱图库中的数据挖掘.caj 结合数据融合和数据挖掘的医疗监护报警.caj 结合粗糙集理论与扩张矩阵理论的数据挖掘方法.caj 股票信息的数据挖掘.caj 试论数据挖掘与机器学习、统计学、数据库的关系.caj 遗传算法的自适应代沟的替代策略研究.pdf 金融数据挖掘中的非线性相关跟踪技术(英文).caj 非线性控制系统的近似化方法.pdf 非线性时延对象的神经网络控制.pdf 非线性系统的鲁棒采样最优控制.pdf 非线性系统鲁棒控制理论的一些新进展.pdf 非线性系统鲁棒耗散控制.pdf 面向21世纪的过程控制技术.pdf 面向属性的RST在数据挖掘中的应用.caj 面向数据挖掘的时间序列符号化方法研究.kdh 面向集成竞争情报系统的数据挖掘应用研究.caj 预测性模型中的一种数据挖掘算法.kdh
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值