深度学习时间序列

最新推荐文章于 2024-07-21 07:50:37 发布

ZhengXinTang

最新推荐文章于 2024-07-21 07:50:37 发布

阅读量90

点赞数

分类专栏： # 时序分析文章标签：深度学习人工智能

原文链接：naokexue.com

版权

时序分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

点击下方卡片，关注“脑科学与智能公众号”

脑科学与智能前沿成果，第一时间送达。

WWW2023为中国计算机学会交叉**/综合/新兴A类会议，也是计算机交叉学科领域最具影响力的会议之一，于北京时间4月30日至5月4日举行。许多不同的计算机学科领域都可投递WWW****，包括但不限于NLP, Data Mining, Database, IR, Internet Economics, HCI, Security等。本次共收到论文1900篇，接受了365篇，录用率仅为****19.2%**

相关论文围绕时间序列预测、异常检测以及其他序列问题展开归纳并汇总。

1**.Learning Social Meta-knowledge for Nowcasting Human Mobility in Disaster**

2.GAT-DNS: DNS Multivariate Time Series Prediction Model Based on Graph Attention Network

3.KAE-Informer: A Knowledge Auto-Embedding Informer for Forecasting Long-Term Workloads of Microservices

4.Detecting Socially Abnormal Highway Driving Behaviors via Recurrent Graph Attention Networks

5.Fast and Multi-aspect Mining of Complex Time-stamped Event Streams

6.ELASTIC: Edge Workload Forecasting based on Collaborative Cloud-Edge Deep Learning

7.Modeling Dynamic Interactions over Tensor Streams

8.Look Deep into the Microservice System Anomaly through Very Sparse Logs

9.DeeProphet: Improving HTTP Adaptive Streaming for Low Latency Live Video by Meticulous Bandwidth Prediction

10.Regime-based Implied Stochastic Volatility Model for Crypto Option Pricing

11.Impact of COVID-19 Pandemic on Cultural Products Interests

12.EDITS: An Easy-to-difficult Training Strategy for Cloud Failure Prediction

13.Forecasting COVID-19 Vaccination Rates using Social Media Data

14.GROUP: An End-to-end Multi-step-ahead Workload Prediction Approach Focusing on Workload Group Behavior

【1】 Learning Social Meta-knowledge for Nowcasting Human Mobility in Disaster

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583991

代码链接： https://github.com/YalDan/icc.isvm

****研究方向：****时间序列预测

******一句话总结全文：******学习社会元知识，预测灾难中的人员流动，模型可以在国家层面和州层面的灾害情况下实现临近人类流动性预报的卓越性能。

研究内容： 人口流动临近预报是智能交通规划、灾害响应与管理等领域的基础性研究问题。尤其是飓风和大流行病等大灾害下的人口流动在很大程度上偏离了日常生活，这使得该任务更具挑战性。现有工作主要集中在正常情况下的交通或人群流量预测。为了解决这个问题，在本研究中，与灾难相关的Twitter数据被纳入协变量，以了解公众对灾难事件的认识和关注，从而了解它们对人类流动性的影响。因此，我们提出了一种元知识可记忆时空网络(MemeSTN)，它利用记忆网络和元学习来融合社交媒体和人类移动数据。对包括日本 2019 年台风季、日本2020年COVID-19大流行和美国2019年飓风季在内的三场现实世界灾难进行了广泛的实验，以说明我们提出的解决方案的有效性。与最先进的时空深度模型和多元时间序列深度模型相比，我们的模型可以在国家层面和州层面的灾害情况下实现临近人类流动性预报的卓越性能。

【2】 GAT-DNS: DNS Multivariate Time Series Prediction Model Based on Graph Attention Network

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543873.3587329

代码链接： https://github.com/YalDan/icc.isvm

研究方向： 异常检测方法

一句话总结全文： 提出了一种基于图注意力网络和图嵌入的DNS异常检测方法，不仅提高了精度、召回率和F1值，而且提高了模型的时间效率。

研究内容： DNS作为互联网最基础的服务之一，曾遭受过多次攻击。现有的攻击检测方法依赖于对恶意样本的学习，很难检测到新的攻击和长期攻击。本文将DNS数据流转化为时间序列，提出了一种基于图注意力网络和图嵌入的DNS异常检测方法（GAT-DNS）。 GAT-DNS 建立了一个多变量时间序列模型来描述DNS服务状态。当某个特征的实际流量超过预测范围时，认为发现了异常的DNS行为。本文提出顶点依赖来描述特征之间的依赖关系。删除具有高顶点依赖值的特征以实现模型压缩。这提高了系统效率。在开放数据集上的实验表明，与最新的AD-Bop和QLAD方法相比，GAT-DNS方法不仅提高了精度、召回率和F1值，而且提高了模型的时间效率。

【3】 KAE-Informer: A Knowledge Auto-Embedding Informer for Forecasting Long-Term Workloads of Microservices

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583288

研究方向： 时间序列预测

一句话总结全文： 一种用于预测微服务长期工作负载的知识自动嵌入Informer，从40个微服务收集的QPS数据集上与最先进的模型相比，达到较优的实验效果。

研究内容： 根据量化为每秒查询数(QPS)的吞吐量准确预测工作负载对于微服务弹性调整其资源分配至关重要。然而，长期QPS预测在两个方面具有挑战性：1）具有不同时间模式的各种服务的通用性，2）由多个组件纠缠在一起的复杂QPS序列的特征。在本文中，我们提出了一种知识自动嵌入Informer网络（KAE-Informer），用于预测微服务的长期 QPS 序列。通过分析大量的微服务轨迹，我们发现QPS序列中有两个主要的可分解和可预测的组件，即全局趋势和主导周期性(TP)以及具有长程依赖性的低频残差模式。这两个组成部分对于准确预测长期QPS很重要。首先，KAE-Informer通过数学建模嵌入TP组件的知识。其次，KAE-Informer设计了一个卷积ProbSparse自注意力机制和一个多层事件判别方案，分别提取和嵌入残差成分中隐含的局部上下文感知和事件回归效应的知识。我们基于三个真实数据集进行实验，包括从40个微服务收集的QPS数据集。实验结果表明，与最先进的模型相比，KAE-Informer的MAPE、MAE和RMSE分别降低了约16.6%、17.6%和23.1%。

【4】 Detecting Socially Abnormal Highway Driving Behaviors via Recurrent Graph Attention Networks

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583452

研究方向： 异常驾驶行为检测

一句话总结全文： 基于递归图注意力网络的高速公路社会异常驾驶行为检测，展示了真实世界HighD交通数据集的性能。

研究内容： 随着物联网技术的快速发展，下一代交通监控基础设施通过网络连接，以帮助交通数据收集和智能交通管理。交通中最重要的任务之一是异常检测，因为异常驾驶员会降低交通效率并引起安全问题。这项工作的重点是从高速公路视频监控系统产生的轨迹中检测异常驾驶行为。目前大多数异常驾驶行为检测方法都集中在处理单一车辆的有限类别的异常行为上，而不考虑车辆交互。在这项工作中，我们考虑检测各种社会异常驾驶行为的问题，即不符合附近其他司机行为的行为。由于车辆相互作用的多样性和高速公路交通的时空变化性质，这项任务变得复杂。为了解决这个问题，我们提出了一种带有循环图注意力网络的自动编码器，它可以捕获周围汽车上下文化的高速公路驾驶行为，并检测偏离学习模式的异常情况。我们的模型可扩展到拥有数千辆汽车的大型高速公路。对交通模拟软件生成的数据进行的实验表明，在最先进的异常检测模型中，我们的模型是唯一能够准确发现进行社会异常行为的车辆的模型。我们进一步展示了真实世界HighD交通数据集的性能，我们的模型在其中检测到违反当地驾驶规范的车辆。

【5】 Fast and Multi-aspect Mining of Complex Time-stamped Event Streams

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583370

研究方向： 复杂时间戳事件流分析

一句话总结全文： 复杂时间戳事件流的快速多方面挖掘，可以正确地发现有意义的模式和异常，并且在准确性和执行速度方面始终优于最先进的方法。

研究内容： 给定具有多个属性的大量在线时间演变事件流，例如在线购物日志：（商品、价格、品牌、时间），我们如何总结大型动态高阶张量流？我们如何才能看到任何隐藏的模式、规则和异常？我们的答案是在高阶张量流上关注两种类型的模式，即“regimes”和“components”，为此我们提出了一种高效且有效的方法，即CubeScope。具体来说，它识别任何突然的中断并识别不同的动态模式，“制度”（例如，工作日/周末/假期模式）。在每个机制中，它还对所有属性（例如，商品、价格、品牌和时间）执行多路汇总，并发现代表潜在组（例如，商品/品牌组）及其关系的隐藏“组件”。由于其简洁但有效的总结，CubeScope还可以检测异常的突然出现并识别在实践中发生的异常类型。我们提出的方法具有以下特性：（a）有效：它捕获动态的多方面模式，即制度和组成部分，并统计总结所有事件；(b)通用：成功应用于各类张量流的数据压缩、模式发现和异常检测具有实用性；©可扩展：我们的算法不依赖于数据流的长度及其维度。对真实数据集的大量实验表明，CubeScope可以正确地发现有意义的模式和异常，并且在准确性和执行速度方面始终优于最先进的方法。

【6】 ELASTIC: Edge Workload Forecasting based on Collaborative Cloud-Edge Deep Learning

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583436

研究方向： 平衡工作负载预测

一句话总结全文： 基于协作云边缘深度学习的边缘工作负载预测，结果优于最先进的方法，减少了时间消耗，并降低了通信成本。

研究内容： 后疫情时代边缘计算快速发展，精准的工作量预测被认为是充分利用边缘有限资源的基础，边缘服务提供者（ESP）和边缘服务消费者（ESC）都可以显着受益从中。现有的工作负载预测范例（即仅边缘或仅云）是不合适的，因为没有考虑站点间的相关性，并且可能会遭受严重的数据传输延迟。随着Web服务越来越多地采用边缘平台，平衡工作负载预测的准确性和效率至关重要。在本文中，我们提出了ELASTIC，这是第一项利用云-边缘协作范式通过多视图图进行边缘工作负载预测的研究。具体来说，在全局阶段，我们在每个边缘站点上设计了一个可学习的聚合层，以减少时间消耗，同时捕获站点间的相关性。此外，在本地阶段，我们设计了一个结合站点内相关性和站点间相关性的解聚层，以提高预测精度。从中国最大的边缘服务提供商收集的真实边缘工作负载数据集的大量实验表明，ELASTIC 优于最先进的方法，减少了时间消耗，并降低了通信成本。

【7】 Modeling Dynamic Interactions over Tensor Streams

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583458

研究方向： 序列预测

一句话总结全文： 张量流上的动态交互建模，提取了数据属性之间的可解释交互，同时提供了更高的预测准确性并大大减少了计算时间。

研究内容： 许多web应用程序，例如搜索引擎和社交网络服务，不断产生大量具有多阶张量形式的事件，因此我们如何发现重要趋势以使我们能够预测长期的未来事件？我们能否从多方面的角度解读决定趋势的事件之间的关系？现实世界的在线活动可以由（1）许多控制趋势的时变交互组成，例如，竞争/合作以获得用户关注，以及（2）涵盖趋势的季节性模式。为了通过交互（即张量流上的动态交互）对变化趋势进行建模，在本文中，我们提出了一种流算法 DISMO，我们旨在发现多阶张量中的动态交互和季节性。我们的方法具有以下特性。(a)可解释的：它将可解释的非线性微分方程纳入张量分解中，从而可以揭示潜在的交互关系，从而有效地生成未来事件；(b)动态：通过切换多方面因素，逐步总结其特征，可以了解变化趋势；©自动：它会自动找到每个因素，而不会失去预测的准确性。对真实数据集的大量实验表明，我们的算法提取了数据属性之间的可解释交互，同时提供了更高的预测准确性并大大减少了计算时间。

【8】 Look Deep into the Microservice System Anomaly through Very Sparse Logs

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583338

研究方向： 时间序列异常检测

一句话总结全文： 从极稀疏日志看微服务系统异常，优于许多最先进的方法，并反映了因果单峰化对原始度量插补的优越性。

研究内容： 由于服务依赖的动态性，密集监控和异常诊断已成为现代微服务架构的一个棘手问题。虽然之前的大多数研究都严重依赖于充足的监控指标，但我们提出了一个基本但总是被忽视的问题——诊断指标完整性问题。本文通过提出MicroCU解决了这个问题——一种使用非常稀疏的API日志诊断微服务系统的新方法。我们设计了一个名为动态因果曲线的结构来描绘随时间变化的服务依赖关系，并设计了一种基于格兰杰因果区间的时间动态发现算法。我们的算法生成了一个更平滑的因果曲线空间，并设计了因果单峰化的概念来校准由缺失指标带来的因果不真实。最后，提出了一种基于动态因果关系图的路径搜索算法来查明根本原因。对商业系统案例的实验表明，MicroCU优于许多最先进的方法，并反映了因果单峰化对原始度量插补的优越性。

【9】 DeeProphet: Improving HTTP Adaptive Streaming for Low Latency Live Video by Meticulous Bandwidth Prediction

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583364

研究方向： 时序预测

一句话总结全文： 通过精细的带宽预测改进低延迟实时视频的HTTP自适应流，与现有算法相比，DeeProphet整体QoE提高了17.7%-359.2%，中值带宽预测误差降低至2.7%。

研究内容： HTTP自适应流(HAS)的性能在很大程度上取决于端到端网络带宽的预测。越来越流行的低延迟直播（LLLS）面临更大的挑战，因为它需要准确的短期带宽预测，而VOD流需要长期带宽预测并且对预测误差具有良好的容忍度。部分挑战来自这样一个事实，即短期带宽会经历巨大的突然变化和不确定的波动。此外，由于LLLS的块间和块内发送空闲，很难在LLLS中获得有效的带宽测量样本。在这项工作中，我们提出了DeeProphet，这是一种用于在LLLS中准确预测带宽以提高HAS性能的系统。DeeProphet通过使用细粒度的TCP状态信息收集有效测量样本来识别数据包突发间隔，并结合时间序列模型和基于学习的模型来预测大的变化和不确定的波动，从而克服了上述挑战。实验结果表明，与state-of-the-art LLLS ABR算法相比，DeeProphet整体QoE提高了17.7%-359.2%，中值带宽预测误差降低至2.7%。

【10】 Regime-based Implied Stochastic Volatility Model for Crypto Option Pricing

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543873.3587621

代码链接： https://github.com/YalDan/icc.isvm

研究方向： 时间序列预测

一句话总结全文：基于制度的隐式随机波动性加密期权定价模型，能够根据参与者的期望以自适应方式对市场进行定价，并将该程序应用于涵盖以前未探索的DA动态的新数据集。

研究内容： 比特币(BTC)等数字资产(DA)的日益普及提高了对准确期权定价模型的需求。然而，现有方法无法应对新兴DA的易变性。已经提出了许多模型来解决非正统的市场动态以及由DA市场中的非平稳性和特殊统计数据引起的微观结构的频繁中断。然而，它们要么容易出现维数灾难，因为采用传统理论需要额外的复杂性，要么它们会过度拟合可能永远不会重复的历史模式。相反，我们利用隐含随机波动率模型（ISVM)对市场机制(MR)聚类的最新进展，对涵盖流行交易平台Deribit上BTC期权的最新数据集进行分析。时间制度聚类是一种时间聚类方法，它将市场的历史演变聚类到不同的波动期，以解释非平稳性。ISVM可以通过使用隐含波动率(IV)数据将投资者预期纳入每个情绪驱动时期。在本文中，我们将这种集成的时间机制聚类和ISVM方法（称为MR-ISVM）应用于BTC期权的高频数据。我们证明MR-ISVM有助于克服对期权定价模型高阶特征跳跃的复杂适应负担。这使我们能够根据参与者的期望以自适应方式对市场进行定价，并将该程序应用于涵盖以前未探索的DA动态的新数据集。

【11】 Impact of COVID-19 Pandemic on Cultural Products Interests

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543873.3587594

研究方向： 兴趣时间序列分析

一句话总结全文： 新冠肺炎疫情对文化产品利益的影响。

研究内容： COVID-19大流行对人类行为产生了重大影响，它如何影响人们对文化产品的兴趣是一个尚未解决的问题。虽然先前的研究大多采用主观调查来寻找答案，但这些方法总是存在成本高、规模有限和主观偏见的问题。受互联网上丰富的面向用户的数据的启发，这项工作探索了利用用户的搜索日志来反映人类潜在的文化产品兴趣的可能性。为了进一步研究COVID-19流动政策如何影响文化兴趣的变化，我们提出了一种新的不连续回归设计，它具有预测人们文化产品兴趣恢复阶段的额外潜力。通过分析6个国家/地区的1592次搜索兴趣时间序列，我们发现在COVID-19大流行期间，人们对电影、音乐和艺术的兴趣发生了不同的变化模式，但整体增量明显增加。在我们研究的六个国家中，我们发现对文化产品兴趣的变化与流动性密切相关，随着流动性下降，对电影、音乐和艺术的兴趣分别平均增加35、27和20，这些变化至少持续八周。

【12】 EDITS: An Easy-to-difficult Training Strategy for Cloud Failure Prediction

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543873.3584630

研究方向： 时间序列异常检测

一句话总结全文： 云故障预测的一种从简单到困难的训练策略，已成功应用于Microsoft 365和Azure在线服务系统，明显减少了云故障造成的经济损失。

研究内容： 云故障一直是云服务可靠性的主要威胁。已经提出了许多故障预测方法来在云故障实际发生之前对其进行预测，以便采取主动措施来确保服务可靠性。在工业实践中，现有的故障预测方法主要侧重于利用最先进的时间序列模型来提高故障预测的性能，但忽视了训练策略。然而，正如curriculum learning指出的那样，当模型按照从易到难的顺序使用数据进行训练时，它们的表现会更好。在本文中，我们提出了EDITS，这是一种用于云故障预测的新型训练策略，它极大地提高了现有云故障预测模型的性能。我们在工业和公共数据集上的实验结果表明，EDITS 可以显着提高云故障预测模型的性能。此外，EDITS也优于其他课程学习方法。更令人鼓舞的是，我们提出的EDITS已成功应用于Microsoft 365和Azure在线服务系统，明显减少了云故障造成的经济损失。

【13】 Forecasting COVID-19 Vaccination Rates using Social Media Data

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543873.3587639

研究方向： 时间序列预测

一句话总结全文： 利用社交媒体数据预测新冠肺炎疫苗接种率，以深入了解每种立场的潜在焦点。

研究内容： COVID-19大流行对国际社会产生了深远影响，疫苗接种已被公认为一项重要的干预措施。为了深入了解公众对COVID-19疫苗的看法，进行了调查研究和对社交媒体平台的分析。然而，现有方法缺乏对个体疫苗接种意图或状态以及公众认知与实际疫苗接种之间关系的考虑。为了解决这些限制，本研究提出了一种文本分类方法来识别表明用户的疫苗接种意图或状态的推文。来自不同类别的推文比例与真实世界疫苗接种数据之间的比较分析显示出显着的一致性，这表明推文可以作为实际疫苗接种状况的先兆。此外，还进行了回归分析和时间序列预测，以探索推文数据的潜力，证明了将推文数据纳入预测未来疫苗接种状态的重要性。最后，将聚类应用于带有正面和负面标签的推文集，以深入了解每种立场的潜在焦点。

【14】 GROUP: An End-to-end Multi-step-ahead Workload Prediction Approach Focusing on Workload Group Behavior

论文链接**：** https://dl.acm.org/doi/abs/10.1145/3543507.3583460

代码链接： https://github.com/YalDan/icc.isvm

研究方向： 时间序列预测

一句话总结全文： 一种端到端的多步骤工作负载预测方法，专注于工作负载组行为，它为实现云原生应用程序的工作负载预测提供了有效的解决方案。

研究内容： 准确预测工作负载可以使Web服务提供商实现对应用程序的主动运行时管理，并确保服务质量和成本效率。对于云原生应用，多个容器协作处理用户请求，使得每个容器的工作负载变化受到工作负载组行为的影响。然而，现有方法主要分析每个容器的个体变化，并没有明确地模拟容器的工作负载组演变，导致次优结果。因此，我们提出了一种工作负载预测方法GROUP，实现了工作负载预测重点从个体到群体、工作负载群体行为表征从数据相似到数据相关、工作负载群体行为从隐式建模到显式建模的转变。首先，我们从多个角度对工作负载组行为及其演变进行建模。其次，我们提出了一种容器相关性计算算法，该算法考虑静态和动态容器信息来表示工作负载组行为。第三，我们提出了一种端到端的多步提前预测方法，该方法明确描绘了工作负载组行为的演变与每个容器的工作负载变化之间的复杂关系。最后，在公共数据集上进行的大量实验显示了GROUP的优势，它为实现云原生应用程序的工作负载预测提供了有效的解决方案。

其他时间序列论文推荐：

NeurIPS 2022丨时间序列（Time Series**）论文汇总**：https://zhuanlan.zhihu.com/p/584036700

KDD 2022丨时间序列（Time Series）论文汇总： https://zhuanlan.zhihu.com/p/557477930

ICML 2022丨时间序列（Time Series）论文汇总： https://zhuanlan.zhihu.com/p/553385328

IJCAI 2022丨时间序列（Time Series）论文汇总： https://zhuanlan.zhihu.com/p/545639857

WWW 2022丨时间序列（Time Series）论文汇总： https://zhuanlan.zhihu.com/p/508825208

ICLR 2022丨时间序列（Time Series）论文汇总： ttps://zhuanlan.zhihu.com/p/466833187

AAAI 2022丨时间序列（Time Series）论文汇总： https://zhuanlan.zhihu.com/p/463629715