KDD 2022时空数据挖掘领域论文汇总

AI蜗牛车

于 2023-02-05 22:35:08 发布

阅读量3.8k

点赞数 2

原文链接：https://mp.weixin.qq.com/s?__biz=MzA4ODUxNjUzMQ==&mid=2247501509&idx=1&sn=54ebf12124df3db1320942de24ba38ef&chksm=902a7419a75dfd0f1e70290d44c948ebd7a93a50b6533bfa9b6b27add4ae722b9130645eca15&scene=126&sessionid=0

版权

KDD 2022是数据挖掘领域的顶级学术会议，第28届会议于2022年8月14-18日在美国华盛顿特区会展中心举行。KDD 2022的Research和Applied Data Science两个Track共收到2448篇投稿，其中449篇被接收发表，总体接收率为18.3%。本文梳理汇总了发表于KDD 2022上的时空数据挖掘（Spatial-Temporal Data Mining）领域20篇论文（如有疏漏，敬请谅解）。

1. Robust Event Forecasting with Spatiotemporal Confounder Learning

作者：Songgaojun Deng, Huzefa Rangwala, Yue Ning

机构：斯蒂文斯理工学院、乔治梅森大学

一句话概括：本文引入了一种新的因果推理模型用于独立因果效应（Individual Treatment Effect）估计，模型通过捕获事件在不同位置的时空依赖性来学习隐藏混杂因素的表示。

论文简介：数据驱动的社会事件预测方法利用相关的历史信息预测未来的事件。这些方法依赖于历史标记数据，当数据有限或质量较差时，预测效果不佳。研究事件之间的因果关系不是进行相关性分析，而是挖掘事件之间潜在的因果关联，从而对事件进行更可靠的预测。然而，在数据驱动的事件预测中引入因果关系分析是具有挑战性的。第一个挑战是，事件发生在一个复杂和动态的社会环境中。许多未观察到的变量，即隐藏的混杂因素，会影响潜在的原因和结果。第二个挑战是，对于时空非独立同分布数据，建模隐藏混杂因素从而准确估计因果效应并非易事。在这项工作中，本文引入了一个深度学习框架，将因果效应估计集成到事件预测中。其首先研究了从具有时空属性的观测事件数据中估计独立因果效应（Individual Treatment Effect）的问题，并提出了一种新的因果推理模型来估计独立因果效应。然后，将学习到的事件因果信息作为先验知识融入到事件预测中。通过引入两个鲁棒性强的学习模块，包括特征加权模块和近似约束损失模块，事件预测模型实现了先验知识的注入。本文在公开事件数据集上评估了所提出的因果推理模型，并通过将学习到的因果信息输入到不同的深度学习方法，验证了所提出的鲁棒学习模块在事件预测中的有效性。实验结果证明了所提出的因果推理模型在社会事件的独立因果效应估计问题上的优势，并验证了鲁棒学习模块有助于社会事件预测。

2. Spatio-Temporal Trajectory Similarity Learning in Road Networks

作者：Ziquan Fang, Yuntao Du, Xinjun Zhu, Danlei Hu, Lu Chen，Yunjun Gao，Christian S. Jensen，

机构：浙江大学、奥尔堡大学

一句话概括：将轨迹匹配至路网后进行相似性计算，对轨迹的离散化建模更加精确；同时，计算轨迹相似度时，考虑了时间维度的相似性。

论文简介：轨迹的相似度计算是轨迹学习中的一个基本问题。作者发现：现有的轨迹相似度的计算和拟合方法都局限于空间维度，没有考虑轨迹在时间维度的相似性。此外，现有方法在建模空间相似度时，都没有考虑路网的约束。文章提出的ST2Vec模型定义轨迹嵌入向量的内积为轨迹间的相似度。在轨迹嵌入时，模型通过时间建模模块提取时间信息，基于包含GCN的空间建模模块提取路网上轨迹点的位置信息，并通过时空注意力融合模块提取时空交互信息，最终通过轨迹编码层获得轨迹的最终嵌入表示。为提高嵌入学习的收敛速度和训练效率，作者设计了一种基于课程学习（curriculum learning）的对比损失用于加速训练。模型在两个公开数据集上与先前的轨迹相似度计算模型进行对比实验，并提供了个案研究；实验结果证明了该模型具有更好的准确性、效率和鲁棒性。

3. Mining Spatio-Temporal Relations via Self-Paced Graph Contrastive Learning

作者：Rongfan Li, Ting Zhong, Xinke Jiang, Goce Trajcevski, Jin Wu, Fan Zhou

机构：电子科技大学、爱荷华州立大学

一句话概括：提出了一种新的自适应图构造策略——自步调图对比学习(SPGCL)，通过最大化正邻居和负邻居之间的区别来学习节点之间的关系，并使用自步调策略生成最优图，解决了预定义图不可用时，表示能力和预测结果受到限制的问题。

论文简介：在位置约束时间序列学习中，建模复杂的空间和时间依赖关系是必不可少的。现有的方法，主要依靠图神经网络(gnn)和基于递归神经网络的时间学习模块，已经取得了显著的性能改进。然而，当预定义图不可用时，它们的表示能力和预测结果受到限制。与专注于设计复杂架构的时空gnn不同，我们提出了一种新的自适应图构造策略:自步调图对比学习(SPGCL)。它通过最大化正邻居和负邻居之间的区别来学习节点之间的关系，并使用自步调策略生成最优图。具体而言，每一轮的每个邻域迭代吸收亲和度最高的可靠节点作为新的邻居节点，并通过数据增强的方式来提高可模型的转移性和鲁棒性。当自适应自步调图逼近优化图进行预测时，节点与对应邻居之间的互信息是最大化的。我们的工作为解决欧几里得空间信息聚合之外的时空学习问题提供了一个新的视角，并可推广到不同的任务。在两个典型的时空学习任务（交通预测和陆地位移预测）上进行的大量实验表明，SPGCL的性能优于最先进的技术。

4. MSDR: Multi-Step Dependency Relation Networks for Spatial Temporal Forecasting

作者：Dachuan Liu, Jin Wang, Shuo Shang, Peng Han

机构：电子科技大学、加利福尼亚大学洛杉矶分校、奥尔堡大学

一句话概括：提出了多步依赖关系（MSDR），通过显式地从多步的历史时间中提取长程依赖关系，能够捕获交通网络中复杂和长距离的时空依赖。

论文简介：提升智能交通系统服务质量的关键技术就是时空流量预测。由于交通网络中复杂且长期的时空依赖性，这项任务具有一定的挑战性。现有方法通常使用各种各样的深度神经网络来学习时间和空间的表示，以捕捉复杂和动态的依赖关系。从时间提取模块学习的隐式表示中捕获远程空间依赖关系是不充分的，为了解决这种不充分的问题，本文提出了多步依赖关系（MSDR），这是一种新的循环神经网络的变体。这种方法不仅仅关注最近一个时间步的隐藏状态，而是显式地将多个历史时间步作为每个时间单元的输入。与此同时，我们制定了两种策略来在多历史时间步和当前时间步之间将空间信息结合到依赖关系的嵌入。在此基础上，用一种基于图的MSDR框架（GMSDR）将图神经网络与MSDR无缝集成，以此来支持一般时空预测的应用。本文提出的模型在多个常见的时空数据集上的表现较如今流行的方法均得到了提升。

5. Spatio-Temporal Graph Few-Shot Learning with Cross-City Knowledge Transfer

作者：Bin Lu, Xiaoying Gan, Weinan Zhang, Huaxiu Yao, Luoyi Fu, Xinbing Wang

机构：上海交通大学，斯坦福大学

一句话概括：提出一种模型无关的时空图学习框架，以应对跨城市知识迁移中不同城市时空图的结构和特征的差异性带来的挑战，可用于解决目标城市的小样本时空图学习问题。

论文简介：时空图学习是交通流量、出租车需求、空气质量预测等城市计算任务的关键方法。由于数据收集成本很高，一些发展中的城市几乎没有可用的数据，这使得训练一个性能良好的模型不可行。为了应对这一挑战，跨城市知识转移具有很广阔的应用前景，即利用从数据充足的城市中学到的模型来辅助数据稀疏的城市的模型学习。然而，不同城市之间的时空图呈现出不规则的结构和不同的特征，从而限制了现有的小样本学习方法的可行性。因此，我们提出了一种模型无关的时空图小样本学习框架，称为ST-GFSL。具体而言，为了通过迁移跨城市知识来增强特征提取，ST-GFSL提出基于节点级元知识生成非共享参数。目标城市中的节点通过参数匹配传递知识，从相似的时空特征中进行检索。此外，我们提出在元学习过程中重构图的结构。定义了图重构损失，来指导结构感知学习，避免了不同数据集之间的结构偏差。我们在四个交通速度预测基准测试上进行了全面的实验，结果证明了与最先进的方法相比，ST-GFSL具有有效性。

6. Pre-training Enhanced Spatial-temporal Graph Neural Network for Multivariate Time Series Forecasting

作者：Zezhi Shao, Zhao Zhang, Fei Wang, Yongjun Xu

机构：中国科学院大学

一句话概括：本文提出了一种预训练框架以有效地从长期历史时间序列中学习时间模式，并生成片段级的表示，以增强时空图神经网络，实现准确的多元时间序列预测。

论文简介：多元时间序列 (MTS) 预测在众多应用中起着至关重要的作用。近年来，时空图神经网络 (Spatial-Temporal Graph Neural Networks, STGNNs) 已成为越来越受欢迎的MTS预测方法。STGNN通过图神经网络和时序模型联合建模MTS的时空模式，显著提高了预测 MTS 的精度。但受模型复杂性的限制，大多数STGNN模型只考虑短期的MTS历史数据，如过去一小时的数据。然而，时间序列的模式和空间之间的依赖关系需要基于长期历史的MTS数据进行分析。为了解决这个问题，本文提出了一种新的框架，其中STGNN被一个可扩展的预训练时间序列框架(STEP)所增强。具体来说，本文设计了一个预训练模型，以有效地从长期历史时间序列（例如，过去两周）学习时间模式，并生成片段级的表示。这些片段级表示为输入STGNN中当前片段短期时间序列提供上下文信息，并促进时间序列之间的建模依赖性。在三个公开的真实数据集上的实验表明，本文的框架能够显著增强下游的STGNN，并且本文的预训练模型充分捕捉了长时时间模式和空间依赖关系。

7. Beyond Point Prediction: Capturing Zero-Inflated & Heavy-Tailed Spatiotemporal Data with Deep Extreme Mixture Models

作者：Tyler Wilson, Andrew McDonald, Asadullah Hill Galib, Pang-Ning Tan, Lifeng Luo

机构：密歇根州立大学

一句话概括：提出Deep Extreme Mixture Model (DEMM)，该模型融合了基于深度学习的门槛模型和极值理论，实现了具有零膨胀，重尾分布特性的时空变量的点和分布预测。

论文简介：零膨胀、重尾时空数据在科学和工程领域很常见，涵盖很广，从气候科学到气象学和地震学。在这种情况下的一个主要建模目标是预测极端和非极端事件的强度、频率和时间。然而，在深度学习背景下，实现这个目标需要解决一些关键挑战。首先，应用于此类数据的深度学习框架必须统一描述零事件、中等事件和极端事件的混合分布。其次，该框架需要在混合分布的每个组成成分中实现对参数的约束。最后，该框架必须足够灵活，以适应训练后用于定义极端事件的阈值发生的变化。为解决这些挑战，本文提出Deep Extreme Mixture Model (DEMM)，该模型融合了基于深度学习的门槛模型和极值理论，实现了具有零膨胀，重尾分布特性的时空变量的点估计和分布预测。该框架可以在推理时动态设置定义极端事件的阈值，而不需要重新训练模型。我们做了大量的实验，将DEMM应用于降水量预测，并观察到该模型在点估计和分布预测任务中实现了显著的效果提升。

8. MetaPTP: An Adaptive Meta-optimized Model for Personalized Spatial Trajectory Prediction

作者：Yuan Xu, Jiajie Xu, Jing Zhao, Kai Zheng, An Liu, Lei Zhao, Xiaofang Zhou

机构：苏州大学、香港科技大学

一句话概括：提出了一种用户个性化轨迹预测的元学习方法MetaPTP，建模了用户的相似度，并且能够处理用户冷启动以及用户-轨迹冷启动问题。

论文简介：本文提出了一种元学习方法MetaPTP用于解决个性化的轨迹预测问题。为了解决用户冷启动以及用户-轨迹冷启动问题，文章采用基于软聚类的方法，根据用户的空间分布情况将具有相似出行偏好的用户分组到同一个类别中，以便更好地在相似用户之间传递共享知识。本文设计了一个用户类别维度的参数存储器，可以根据用户的偏好在初始化阶段提供偏向于用户的网络参数。为了进行个性化推荐，引入一种融合用户偏好以及空间相关的轨迹采样方法生成有意义的支持集和一个自适应的权重生成器，为支持集中的不同轨迹样本自适应地分配权重。最后在北京和波尔图数据集上进行了大量实验说明了其有效性。

9. Characterizing Covid Waves via Spatio-Temporal Decomposition

作者：Kevin Quinn, Evimaria Terzi, Mark Crovella

机构：波士顿大学

一句话概括：提出了一种考虑空间结构的矩阵分解方法，并展示了如何使用迭代式方法进行构建，针对疾病或者大流行数据能够识别不同的时间传播模式（waves）以及空间中心。

论文简介：在本文中，我们开发了一个框架来分析疾病或流行病（例如Covid）的模式。给定一个记录有关疾病在一组位置上传播信息的数据集，我们考虑识别疾病的时间传播模式（waves）以及空间上中心位置（epicenters）的问题。为此我们引入了一种新的时空分解方法，称之为扩散NMF (d-NMF)。在经典矩阵分解方法的基础上，d-NMF考虑了数据中位置（特征）的空间结构，并提出空间上靠近的位置更有可能经历相同时间模式传播的想法。为了阐述 d-NMF 的效果，我们分析了各种空间粒度的Covid病例数据。我们的结果表明，d-NMF在分解流行病的时间传播模式和识别每一次传播时的空间中心位置是有用的。

10. Service Time Prediction for Delivery Tasks via Spatial Meta-Learning

作者：Sijie Ruan, Cheng Long, Zhipeng Ma, Jie Bao, Tianfu He, Ruiyuan Li, Yiheng Chen, Shengnan Wu, Yu Zheng

机构：北京理工大学、京东、新加坡南洋理工大学

一句话概括：提出结合元学习的服务时间预测模型MetaSTP，其特色在于建模了单元级、楼层级细粒度特征，以及使用元学习增强了地点级先验知识。

论文简介：服务时间是“最后一公里派送”的时间成本中的一部分，即在特定地点交付包裹所花费的时间。预测服务时间是许多末端物流应用的基础，例如，具有时间窗口的路线规划、快递员工作量平衡和交付时间预测。然而，复杂的交付环境、位置异质性给准确预测带来了巨大挑战。现有解决方案基于监督模型，将要交付的包裹中提取的聚合特征用于训练，但这些方案无法很好地处理上述挑战。在本文中，作者们提出了一种基于元学习的神经网络模型MetaSTP来预测服务时间。MetaSTP将每个地点的服务时间预测视为一项学习任务，利用基于Transformer的表示层对复杂的交付环境进行编码，并设计了一种基于模型的元学习方法，该方法通过地点先验知识增强，以保留每个地点的唯一性并处理不平衡分布问题。实验表明，在两个真实数据集上，MetaSTP至少比基线高出9.5%和7.6%。最后，在京东物流内部部署并使用了基于MetaSTP的智能运单分配系统。

11. Graph2Route: A Dynamic Spatial-Temporal Graph Neural Network for Pick-up and Delivery Route Prediction

作者：Haomin Wen, Youfang Lin, Xiaowei Mao, Fan Wu, Yiji Zhao, Haochen Wang, Jianbin Zheng, Lixia Wu, Haoyuan Hu, Huaiyu Wan

机构：北京交通大学、菜鸟网络

一句话概括：提出一种基于动态时空图神经网络的揽派路径预测模型Graph2Route，首次将揽派路线预测问题建模成为图上的预测问题。

论文简介：本文研究城市末端揽派中顺序预测问题。顺序预测是末端揽派中的基础能力，服务于多个下游任务(如派单、时效预测等)，由于实操中快递员的实际路线与计划路线之间存在很大的偏差，因此需要持续优化顺序预测的准确性。本文首次从图的角度描述PDRP任务(Pick-up and Delivery Route Prediction task)，并提出一个基于“动态时空图”的模型——Graph2Route，Graph2Route首先利用一个动态ST-Graph编码器来充分捕捉不同任务的时空相关性和决策环境的演变，并在解码过程中利用了底层图的结构，得到合理的解码路线。最后，以快递寄件和外卖配送的真实数据为例进行实验，证明模型的有效性。

12. Spatio-Temporal Vehicle Trajectory Recovery on Road Network Based on Traffic Camera Video Data

作者：Fudan Yu, Wenxuan Ao, Huan Yan, Guozhen Zhang, Wei Wu, Yong Li

机构：清华大学、商汤科技

一句话概括：结合交通摄像头视频数据，提出了一种迭代的框架，用于解决交通路口级别的所有车辆轨迹恢复任务。

论文简介：大量车辆轨迹的产生为分析城市交通带来了巨大的便利，可推动智慧交通系统的构建，服务于很多应用。由于传统方法只基于部分轨迹数据，它们无法恢复道路上所有车辆的轨迹。为了解决这个问题，我们研究了基于交通摄像头视频数据的所有车辆轨迹恢复。然而，这项研究存在两个挑战。首先，交通摄像头拍摄的图像质量不平衡，因此很难识别相同的车辆。其次，由于交通摄像头的不完整和交通摄像头可能漏掉车辆，交通摄像头观测数据稀疏。为了应对这些挑战，我们设计了一种新颖的系统来恢复具有道路交叉口粒度的车辆轨迹。在这个系统中，我们提出了一个迭代框架来联合优化车辆重识别和轨迹恢复任务。在车辆重识别任务中，我们提出了一种有效的策略来指导基于视觉特征和轨迹发现任务更新的时空约束特征的车辆聚类。在轨迹恢复任务中，我们通过概率方法对空间和时间关系以及车辆未命中问题进行建模以恢复轨迹。大量实验表明，我们的框架优于现有的最先进的解决方案。最后，我们的系统在中国商汤科技的实际应用中进行了部署，包括交通拥堵分析和交通信号控制。

13. Uncertainty Quantification of Sparse Travel Demand Prediction with Spatial-Temporal Graph Neural Networks

作者：Dingyi Zhuang, Shenhao Wang, Haris N. Koutsopoulos, Jinhua Zhao

机构：麻省理工学院、佛罗里达大学、东北大学

一句话概括：本文设计了一个时空零膨胀负二项图神经网络（STZINB-GNN）量化稀疏出行需求的不确定性，可以有效解决稀疏区域的OD出行预测问题。

论文简介：起止点（Origin-Destination，OD）出行需求预测是交通领域一大挑战，近年来时空深度学习模型在该任务上取得了很好的效果。但是这些工作都忽略了O-D的不确定性和稀疏性。由于稀疏性产生了大量的0不符合了确定性深度学习的高斯假设，这样会导致预测严重偏离真实情况。针对这一问题，作者设计了一个时空零膨胀负二项图神经网络（STZINB-GNN）来量化稀疏出行需求的不确定性。该模型利用扩散图卷积（DGCN）和时间卷积(TCN)提取时空相关性，并利用专门的参数П针对稀疏性问题学习零膨胀。然后将融合的时空相关性以参数化出行需求的概率分布。在两个真实世界的数据集上进行实验，STZINB-GNN优于基准模型，尤其是在细粒度的时空下，有着高精度、紧密的置信区间和可解释的参数。其中针对稀疏性的参数Π能在各种交通场景下提供合理的物理解释。

14. Activity Trajectory Generation via Modeling Spatiotemporal Dynamics

作者：Yuan Yuan, Jingtao Ding, Huandong Wang, Depeng Jin, Yong Li

机构：清华大学

一句话概括：提出新颖的基于生成对抗模仿学习的框架，能够生成真实性和实用性更强的用户轨迹，提升人造数据在现实中的可用性。

论文简介：人类日常活动，例如工作、外出就餐和旅行，在密接追踪和 COVID-19 传播模式建模中发挥着重要作用。然而，出于隐私和商业方面的顾虑，从真实场景中收集的个人活动数据非常有限。在本文中，作者提出了一个基于生成对抗模仿学习的新框架，以生成具备真实性和实用性的人造活动轨迹。为了应对不规则采样活动固有的随机性和稀疏性，作者创新地利用神经微分方程，捕捉轨迹背后的时空动态性。作者在时间演化和空间转换中，结合了连续活动之间的连续流动动态，以及观测活动点的瞬时更新。在两个真实世界数据集上的实验表明，本文提出的框架在实际应用中，相较于目前最优的基线，能够提升数据的真实性和实用性。此外，作者使用合成数据建模 COVID-19 传播模式，与基线相比， MAPE 的结果降低了 50% 以上。

15. Selective Cross-City Transfer Learning for Traffic Prediction via Source City Region Re-Weighting

作者：Yilun Jin, Kai Chen, Qiang Yang

机构：香港科技大学

一句话概括：针对跨城市迁移学习时使用源城市数据训练模型可能带来的负面因素，提出一种选择性迁移学习框架，通过源城市区域重加权方式来协助目标城市的微调，以应用于交通预测任务。

论文简介：深度学习模型已被证明可以有效建模复杂的时空数据并实现准确的交通数据预测。在实践中，训练基于深度学习的交通预测模型依赖于大规模的交通数据，而现实场景中积累的数据可能无法满足这一需求。为了应对数据稀缺问题，一种有前景的解决方案是使用跨城市迁移学习技术，微调从源城市充足数据中训练好的模型。但是，现有方法忽略了源城市和目标城市之间的差异，因此，来自源城市的训练好的模型可能包含噪声甚至有害的源知识。为了解决该问题，我们提出了CrossTReS，这是一个用于交通预测的选择性迁移学习框架，可自适应地重加权源区域来为目标微调提供协助。作为一种基于微调的跨城市迁移学习的通用框架，CrossTReS由特征网络、加权网络和预测模型组成。我们用节点和边级的域自适应技术来训练特征网络，以学习源和目标城市的通用空间特征。我们通过源-目标联合元学习进一步训练加权网络，以使有助于目标微调的源区域被分配高权重。最后，利用学习到的权重在源城市上对预测模型进行选择性训练，以初始化目标微调。我们使用真实的出租车和自行车数据评估了CrossTReS，在相同的设置下，CrossTReS的表现优于最先进的基线高达8％。此外，所获的区域权重提供了可解释的可视化。

16. Modeling Network-level Traffic Flow Transitions on Sparse Data

作者：Xiaoliang Lei，Hao Mei，Bin Shi，Hua Wei

机构：西安交通大学、新泽西理工学院

一句话概括：以新颖的“交通操作”视角对交通系统的变化进行抽象，并基于此建模交通状态变化过程，在稀疏的数据上也能得到高准确性的交通状态预测。

论文简介：在城市环境中，对交通网络中的流量变化进行建模对于许多交通领域的应用非常有用，包括交通运输决策、公众安全和城市规划等。交通流量的变化可以被视为交通状态（例如，每个路段上的交通容量）随时间互相间转换的动态过程。在现实中，交通系统若具有交通信号控制，或者可逆车道变换等交通操作，那么其交通状态会受到历史状态和交通操作的影响。在这篇文章中，作者考虑了在现实环境下对交通网络流量进行建模的问题，其中可用数据是稀疏的（即仅对交通系统的一部分进行监控）。作者提出了 DTIGNN 模型，一种可以用稀疏数据进行交通网络流量预测的方法。DTIGNN 将交通系统建模为受交通信号影响的动态网络，学习状态转移模型，并通过插补来预测未来交通状态。经过全面的实验证明，本文提出的方法优于目前最先进的方法，并且可以更好地支持交通决策。

17. Learning to Discover Causes of Traffic Congestion with Limited Labeled Data

作者：Mudan Wang, Huan Yan, Hongjie Sui, Fan Zuo, Yue Liu, Yong Li

机构：清华大学

一句话概括：用有标签的数据来训练一个拥塞特征抽取的模型，之后用该模型对未知和已知的交通路况抽取特征，然后使用聚类的方法，给出拥塞原因。

论文简介：交通拥堵导致出行时间延误，严重影响我们的日常出行体验。探索交通拥堵的原因对于有效解决交通拥堵问题、提升用户体验具有重要意义。挖掘拥堵原因的传统方法依赖于人力，这既费时又费钱。因此，我们的目标是以系统的方式发现交通拥堵的已知和未知原因。然而，要实现它，面临三个挑战：1）交通拥堵受多种因素影响，时空关系复杂；2）由于人为标签的限制，已知原因的拥塞数据量较少；3) 存在多种因素会导致交通拥堵，更多未知的拥堵原因尚未探索。针对上述挑战，我们设计了一个拥塞原因发现系统，由两个模块组成：1）拥塞特征提取，提取影响拥塞的重要特征；2）拥堵原因发现，它利用基于深度半监督学习的方法通过有限标签数据来发现交通拥堵原因。具体来说，它首先利用一些标记数据作为先验知识来预训练模型。然后，在数据重构损失和KL散度损失的监督下，执行深度嵌入聚类方法生成聚类。大量实验表明，我们提出的方法的性能优于基线。此外，我们的系统已在高德的实际生产环境中部署和使用。

18. Continuous-Time and Multi-Level Graph Representation Learning for Origin-Destination Demand Prediction

作者：Liangzhe Han, Xiaojian Ma, Leilei Sun, Bowen Du, Yanjie Fu, Weifeng Lv, Hui Xiong

机构：北京航空航天大学、中佛罗里达大学、香港科技大学

一句话概括：该模型对于每个交通节点维护一个动态状态向量来表示历史信息并持续进行动态更新，并将交通节点与集群级别和区域级别的虚拟节点进行融合。

论文简介：近些年基于深度神经网络的交通需求预测引起了学术界和工业界广泛的关注。其中，对于出发地-目的地（OD）的需求预测仍然是一个有价值并且具有挑战性的问题。主要存在以下几个难点:（1）庞大的OD对数量（2）隐藏的空间相关性（3）复杂的交通状态。为了解决上述问题，本文提出了一种用于出发地-目的地的需求预测（CMOD）的连续时间多级动态图表示学习方法。首先，构建了一个连续时间动态图表示学习框架，该框架为每个交通节点（地铁站或出租车区域）维护一个动态状态向量，状态向量用于表示历史信息，并根据最近发生的需求来不断进行更新。其次，提出了一种多级结构学习模块，用于建模不同节点之间的空间相关性，不仅可以从数据中自适应地学习节点之间的关系，还可以学习集群级和区域级的虚拟节点之间的关系。最后，设计了一个跨层融合模块，用于融合节点与集群级和区域级虚拟节点之间的关系，得到用于最终预测的节点表示。最后，在来自北京地铁和纽约出租车的两个真实数据集上进行了大量实验，证明了模型相对于现有方法的先进性。

19. Applying Deep Learning Based Probabilistic Forecasting to Food Preparation Time for On-Demand Delivery Service

作者：Chengliang Gao, Fan Zhang, Yue Zhou, Ronggen Feng, Qiang Ru, Kaigui Bian, Renqing He, Zhizhao Sun

机构：美团

一句话概括：将食物准备时间的预测建模成概率预测问题，即预测标签是概率分布而非准确值，提出了基于深度学习的非参数化方法和新的损失优化S-Quantile Loss。

论文简介：外卖平台的食物准备时间（Food Preparation Time，FPT）对消费者和外卖员都很重要，但实际应用时，准确预测FPT面临两个主要挑战：（1）数据标签不足，（2）FPT数据存在巨大的不确定性。文章采用了概率预测（Probabilistic Forecasting，PF），提出了一个基于深度学习的非参数化方法来预测FPT。对于一些没有明确标签的数据，在特征提取和模型构建过程充分利用这类数据的上下界，而数据的不确定性会影响结果的确定性预测，因此采用概率预测方法预测FPT的概率分布而不是准确的值。S-CRPS损失经常用于概率预测问题，并且比MLE损失更具鲁棒性，文章提出了S-Quantile损失（S-QL）并用于模型优化，并证明了S-CRPS与其在区间删失数据（interval-censored data）上的关系。实验在离线数据以及在线A/B测试都证明了提出方法的有效性。

20. Para-Pred: Addressing Heterogeneity for City-Wide Indoor Status Estimation in On-Demand Delivery

作者：Wei Liu, Yi Ding, Shuai Wang, Yu Yang, Desheng Zhang

机构：东南大学

一句话概括：提出一种基于图神经网络的室内状态估计模型ParaPred，重点应对大规模场景（上万商家，数百设备）下的设备异质性和环境异质性挑战。

论文简介：即时配送是近年来一种新兴的物流形式。客户在平台下单后，平台安排配送员在短时间内将客户指定商品进行派送。对于配送平台来说，估计配送员室内状态（即到达或离开商户）在订单调度和路线规划中发挥着重要作用。当前，低功耗蓝牙设备（Bluetooth Low Energy, BLE）由于其较低的硬件成本、部署成本和低功耗等优点，是解决室内状态预测一种有前景的方案。然而，环境异质性和智能设备的异质性会使得状态预估表现下降。以前建模以上异质性的方法不适用于城市大规模场景（成千上万的商家和数百款智能手机）下的室内状态估计。本文设计了Para Pred，利用蓝牙信号异质性之间的相似性构图并基于图神经网络，对于没见过的场景直接预测有效的室内状态估计模型参数进而完成更精准的室内状态估计。

转：时空数据学习

推荐阅读：

我的2022届互联网校招分享

我的2021总结

虽迟但到，我的2022年总结
浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总
公众号：AI蜗牛车

保持谦逊、保持自律、保持进步

发送【蜗牛】获取一份《手把手AI项目》（AI蜗牛车著）
发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书