自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 论文研读 | 路网中多样top-k路径推荐

本篇论文是是2022年发表在数据库领域顶级会议VLDB上的一篇文章,作者为香港科技大学团队。论文提出了一种兼顾完整性和效率的多样路径规划算法,并且在真实的城市路网中进行了效果评估。能够有效指导在实践中的应用。

2024-08-16 09:51:03 623 1

原创 论文研读 | 通过自然语言生成翻译人员流动预测

本篇论文来自2022年的WSDM会议,主要聚焦了利用语言模型来进行流量预测问题,通过将流量预测问题转换为类似prompt的操作,提升流量预测问题建模的可拓展性和通用性。虽然目前在LLM的快速发展下,各个领域类似的工作已经较多地涌现出来,但该论文应该是较早探索这种范式的工作之一,部分方法依然值得参考借鉴。

2024-05-16 15:03:10 709

原创 LLM4TS:使用预训练的 LLM 进行时间序列预测的两阶段微调

本文提出的LLM4TS架构如下图所示。以GPT-2为backbone,图中左侧(a)部分是第一阶段——监督微调阶段,使用自回归方法将主干模型与时间序列数据对齐;图中右侧(b)部分是第二阶段——下游任务微调。下面对本文提出的两阶段微调方法进行详细解释。

2024-04-28 11:15:12 1540

原创 论文研读|基于混合时空模型的地铁客流预测

本文将历史地铁客流分为三种模式(近期、每日和每周)。近期模式表示最近的时间,每日模式和每周模式表示不同日期或周的目标时间的客流历史情况。不同的模式融合有助于研究周期性时间片对目标时间地铁客流的影响。预测过程如下图所示:本文建立了一个混合神经网络模型GCTN来解决地铁客流预测问题。除了捕捉时空相关性外,该模型还考虑了不同时间步长车站之间的相关性,以加强长期客流预测。

2024-03-18 14:26:31 1126 1

原创 论文研读 | 大模型时序应用——基于对比学习的时序数据embedding

Text embedding space of LLM (TEST)总共分为两步:(1)将TS token化,并训练编码器一个encoder,用对比学习表征TS tokens;(2)创建prompts,使LLM对表征更开放,并实现TS任务。

2024-01-19 10:05:52 1996 1

原创 论文研读 | 解耦动态时空图神经网络交通预测

本文是由中科院大学2022年发表于VLDB会议的一篇文章,作者创新地提出了一种解耦时空框架——DSTF,提升了模型在交通流预测任务中的性能,并在两个真实数据集上进行了验证。作者通过将先验知识融合进模型结构中,从而提升模型性能的思路值得借鉴,以下对论文进行分享介绍。

2023-12-25 15:14:23 1473

原创 论文研读 | Anomaly-Transformer:基于关联差异的时间序列异常检测方法

本文是由清华大学2022年发表于ICLR会议的一篇文章,作者创新地提出了一种新的无监督时序异常检测模型——Anomaly Transformer,该模型在服务器监测、地空探索、水流观测等应用中均展现出了优秀的异常检测结果。

2023-11-02 15:27:44 1269 1

原创 时序数据库系列11-时空索引

随着定位技术的不断发展,导致大量的时空数据产生,例如 GPS 设备、手机等,这些设备会定时记录使用者的地理位置。目前各类成熟的数据库大多已支持空间类型和空间索引,比如 Postgresql(关系型)、ElasticSearch(文档型)、Redis(内存型)等,或者一些 KV 数据库比如 HBase,其自身不支持,但 GeoMesa 插件让它支持了空间能力,而在时序数据库领域,空间类型和空间索引支持还有限。

2023-10-24 11:06:37 308

原创 基于双重图卷积注意力网络的个体移动预测

本文推荐的是由清华大学、蒙纳士大学和北京大学2022年共同发表于WSDM会议的一篇文章,作者创新的提出了一种新的图卷积双注意力网络框架Graph ConvolutionalDual-attentive Networks (GCDAN),用以提升人类用户移动预测的准确性。

2023-09-16 11:52:54 237 1

原创 NeurIPS 2022|基于时频一致性的时间序列自监督对比预训练方法

时频一致性(TF-C)的核心思想是确定一个在时间序列数据集中保留的通用属性,并使用它来诱导迁移学习以进行有效的预训练。时域显示传感器读数如何随时间变化,而频域显示在整个频谱的每个频率分量中有多少信号。在高容量方法的情况下,这种方法是足够的,因为时域和频域是同一数据的不同视图,可以使用变换进行交叉转换,如傅立叶和逆傅立叶。基于信号处理理论,这两个域之间的关系提供了一种不变性,无论时间序列分布如何都是有效的,因此可以作为预训练的归纳偏置。基于上述思路,论文作者构建的整体模型结构如下图所示。

2023-08-17 20:10:42 498 1

原创 时序数据库系列10-SQL引擎

SQL语言是一种申明式的语言,不要求用户具备大量的程序语言基础和编程逻辑思维,只需要使用SQL语言准确表达想获取的最终结果,因此使用门槛比较低。并且SQL语言的规范当前已经比较成熟,几乎很少会变化,带来了使用上的稳定性。因此,对于数据库而言,为了其易用性和用户的广泛性,大部分的数据库产品都会提供SQL语言的接口。时序数据库作为数据库的一种特殊类型,也具有广大用户对SQL语言支持的强烈诉求。时序数据库是否支持SQLTDEngine支持TimeScale支持GaussDB支持IOTDB。

2023-07-10 19:35:50 244 1

原创 NeurIPS 2022|非平稳时间序列的Transformer预测框架

Nonstationary Transformers 涉及两个互补部分:Series Stationarization 以增强时间序列的平稳性以获得更好的可预测性,以及 De-stationary Attention 以重新合并原始序列的非平稳信息以防止过度平稳化。在这些设计的支持下,Non-stationary Transformers 可以同时提高数据的可预测性和模型能力。

2023-06-08 11:21:18 939

原创 SIGKDD 2022 | 复杂周期性时间序列预测

本文提出了方法框架——Quaternion Transformer——可以处理复杂的周期模式,并且打破长时间序列预测的计算效率瓶颈,主要目标是对复杂的周期模式进行建模,以实现准确的时间序列预测。框架如下图所示,其中learning-to-rotate attention (LRA) with quaternion用于对时间序列复杂的周期依赖进行建模;trend normalization和layer normalization类似,但强调隐藏层中序列表示的缓慢变化趋势;

2023-05-04 10:31:47 489

原创 时空数据挖掘之轨迹终点识别-论文研读1

本文提出的重卡货运行程终点识别方法架构如下图2所示:图中主要步骤如下:Step1,使用预定的速度阈值从GPS轨迹中识别重卡驻留点(见图2中的步骤1)。如果重卡的速度为零,则认为车辆是静止的。由于GPS漂移的影响,计算出车辆的平均速度通常不为零,本文使用确定的速度阈值从GPS轨迹中识别重卡驻留点(即GPS平均速度小于速度阈值则认为是驻留点);Step2,确定多级时间阈值,并根据重卡的最大停车时间选择一个合适的时间阈值,从重卡驻留点中确定行程终点。

2023-04-17 10:27:54 459

原创 TR Part C | 新能源车充电模式研究

该论文在2022年7月22日发表于Transportation Research Part C期刊,作者是来自于深圳科技大学和阿拉巴马大学的四位学者。了解新能源电动出租车(ET Electric Taxi)充电活动的 "时间、地点和原因",对于优化电动共享交通服务的规划和运营有着较大的意义。准确了解电气化共享出行服务的充电动态,可以协助城市交通设施的优化运营和规划。本篇论文以深圳市大规模电动出租车队的充电行为数据为依据,重点对充电活动的上述三方面时间地点和原因。

2023-04-17 10:25:40 260

原创 时空数据挖掘之轨迹终点识别-论文研读1

本文提出的重卡货运行程终点识别方法架构如下图2所示:图中主要步骤如下:Step1,使用预定的速度阈值从GPS轨迹中识别重卡驻留点(见图2中的步骤1)。如果重卡的速度为零,则认为车辆是静止的。由于GPS漂移的影响,计算出车辆的平均速度通常不为零,本文使用确定的速度阈值从GPS轨迹中识别重卡驻留点(即GPS平均速度小于速度阈值则认为是驻留点);Step2,确定多级时间阈值,并根据重卡的最大停车时间选择一个合适的时间阈值,从重卡驻留点中确定行程终点。

2023-03-13 10:10:04 853

翻译 SIGSPATIAL 2022 | 路网历史路径恢复

定义1.1 路径恢复问题给定一个路网和一段行程的移动对象𝑜,路线恢复问题旨在恢复𝑜所走的路线𝑝。其中是一个具有经纬度坐标的位置,𝜏是一个时间标记。定义1.2 区域恢复问题给定一个路网和一段行程的移动对象𝑜,区域恢复问题旨在恢复一个区域,即𝐺的子网络𝐺′,它包含了𝑝所走过的路线。

2023-02-13 10:45:46 564

翻译 基于稀疏数据的车辆轨迹还原-论文研读

作者通过交通相机抓拍数据、历史的车辆GPS轨迹数据、路网数据等三种数据恢复出路口级的车辆轨迹。论文的方法框架由预处理模块、车辆重识别模块和轨迹恢复模块三部分组成,如下图所示。【预处理模块】使用ResNet50对相机抓拍数据提取视觉特征(外观特征和车牌特征)。使用地图匹配算法将路网数据和历史轨迹数据进行匹配。【车辆重识别模块】论文使用两个经过预训练和微调的ResNet-50模型分别从图像中提取256维的车辆外观特征和256维的车牌特征。

2022-12-17 21:56:35 988

原创 时序数据库系列9-服务框架

目前常见的RPC框架主要有Dubbo、 Thrift、 gRPC等等,这里只介绍这三者。gRPC:是 Google 公布的开源软件,基于 HTTP 2.0 协议,并支持常见的众多编程语言。RPC 框架是基于 HTTP 协议实现的,底层使用到了 Netty 框架的支持。Thrift:是 Facebook 的开源 RPC 框架,主要是一个跨语言的服务开发框架。Dubbo:是阿里集团开源的一个极为出名的 RPC 框架,在很多互联网公司和企业应用中广泛使用。协议和序列化框架都可以插拔是极其鲜明的特色。

2022-11-15 09:36:06 2122

翻译 SigSpatial 2021会议论文研读(4)

城市检测器网络被视为由表示的图,其中是检测器节点的集合,是边的集合。传感器的数量表示,检测器图的邻接矩阵表示为。在每个时间步,检测器图有一个图信号矩阵,它最初表示每个检测器记录的值。因此,给定历史步图信号,交通预测就是学习一个函数来预测下一个步图信号。为了改进特征表达,通过一维卷积增加原始观测的维数,得到。为了清楚起见,本文将层的输入分为三个视图,即短距离视图、中距离视图和远距离视图。对于每个视角的观察,本文基于自注意力机制分别提取动态时间相关性的特征,根据输入动态调整注意力系数。

2022-10-24 09:59:34 282

原创 KDD CUP 2022 风能预测赛题冠军方案分享

KDD CUP竞赛是由ACM 的数据挖掘及知识发现专委会(SIGKDD)主办的数据挖掘研究领域的国际赛事,从1997年开始,每年举办一次,被称为数据挖掘领域的“世界杯”,是该领域水平最高、最有影响力的顶级赛事。今年KDD CUP 共有2个赛题,分别是有百度承办的风电功率预测赛道和亚马逊承办的商品搜索赛道。我们时空大数据小组有幸邀请到了KDD CUP 2022 风电功率预测赛道的冠军团队来分享一下他们的竞赛方案。

2022-10-20 17:05:28 2160 3

翻译 SigSpatial 2021会议论文研读(3)

ACM SIGSPATIAL国际地理信息系统大会(ACM SIGSPATIAL 2021)于2021年11月2日至5日在中国北京举行。该会议始于1993年,旨在汇集研究人员、开发人员、用户和实践者基于地理空间数据和知识,促成跨学科的、覆盖地理信息系统方方面面的交流与合作。本届论文涵盖面较为宽泛,分为6个大类,超过40个小类。接下来,我们将进行一个系列的SigSpatial2021-时空主题论文研读。

2022-10-20 17:04:31 334

翻译 SigSpatial 2021会议论文研读(2)

RM-Drive包含三个阶段(1)预处理阶段:轨迹去噪后,先进行时间离散化,将每天划分为T个等长的时间间隔。然后进行空间离散化,用HlHl​和WlWl​表示在lll-th空间分辨率下的高度和宽度,由此为每个时间间隔生成空间网格图。(2)特征提取:将每组轨迹转化为状态-动作对,以构造时空逆强化学习问题(ST-IRL),基于时间间隔和轨迹分辨率提取时空DMFs,构造驾驶员reward和policy的base map,以及反映POI密度的heat-map和天气向量。

2022-10-20 16:58:40 296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除