时间序列模型
文章平均质量分 96
时间序列模型
数智笔记
目前从事数据挖掘工作,期望在自己学习总结的同时,也能分享有益的东西给别人,希望有志者能在数据挖掘领域共同进步
展开
-
朝向由人工智能生成的洞见:知识图谱与 GPT-4 在电商推荐中的协同作用
电商推荐已经成为在线购物体验的基石,自电商诞生以来经历了显著的演变。在网上零售的早期,推荐系统相对简单,通常基于一些基本标准(如流行度或类别相似性)来建议商品。转折点出现在20世纪90年代末,协同过滤技术的出现;最初的开发是在学术界进行的,亚马逊和Netflix等多家公司在其商业化过程中也作出了贡献。该技术利用用户行为数据,如购买历史和评分,生成个性化的产品建议。这标志着推荐系统从“一刀切”的推荐方式转变为更加定制化的方法,承认了每个用户的多样化偏好。在电商中,有效的推荐系统的重要性不可忽视。原创 2024-08-19 22:33:28 · 836 阅读 · 0 评论 -
时间序列分析:掌握平稳性的概念
平稳时间序列的统计行为在时间上保持不变。这并不意味着它们不变化,它们确实会变化,但这种变化是随机的。一个时间序列必须具备某些统计属性,才能被称为是平稳的:原创 2024-08-19 22:32:13 · 1007 阅读 · 0 评论 -
使用动态时间规整测量时间序列相似性
动态时间规整(Dynamic Time Warping,简称DTW)是一种流行的时间序列分析方法,用于衡量两个可能具有不同长度、非线性扭曲和不同速度的时间序列之间的相似性。这个方法在1978年由Sakoe和Chiba提出,最初用于对齐语音模式。DTW已经在多个领域得到了广泛应用,包括语音识别、图像识别、金融和医疗保健等。照片来自asim alnamat时间序列就是在一段时间内记录的数值序列,比如每日气温或股票价格。DTW是一种允许我们比较可能具有不同长度、形状或速度的时间序列的技术。原创 2024-08-19 22:30:58 · 654 阅读 · 0 评论 -
Copulas:金融世界依赖性的各个方面
让我们深入探讨一下2009年发布的“”这篇引人入胜的故事。该文章揭示了投资者在2008年金融危机期间遭受的巨额损失。如果你没有心情阅读整篇文章,可能会觉得有点冗长,下面是要点:准确衡量金融变量之间的关系对对冲风险至关重要。这篇文章讨论了金融传染现象,并指出华尔街的量化分析师使用的高斯 copula(一个数学公式)在描述这一现象时存在缺陷(稍后我们将解释什么是 copula 以及为什么称之为高斯)。许多投资者和交易者依赖这一错误模型,错误估计了金融资产在高波动期的相互依赖性,导致了重大损失。原创 2024-08-19 22:29:43 · 876 阅读 · 0 评论 -
Python 中的时间序列因果影响分析
在第 6 步中,我们将总结干预对时间序列的因果影响。# 因果影响摘要后验推断 {因果影响}平均值 累积值实际 50.08 10016.92预测 (标准差) 40.03 (1.2) 8005.59 (239.36)绝对效应 (标准差) 10.06 (1.2) 2011.33 (239.36)相对效应 (标准差) 25.12% (2.99%) 25.12% (2.99%)后验尾区概率 p: 0.0后验因果效应概率: 100.0%原创 2024-08-19 18:00:08 · 348 阅读 · 0 评论 -
深度时间序列模型:全面调查与基准
时间序列是指按照离散时间顺序排列的数据点序列,在现实世界的应用中无处不在。与其他模态不同,时间序列由于其复杂和动态的特性,带来了独特的挑战,包括非线性模式和时间变动趋势的纠缠。在现实场景中,分析时间序列数据具有重要意义,并且在几个世纪以来得到了广泛研究。近年来,时间序列研究领域取得了显著突破,技术从传统的统计方法转向先进的深度学习模型。本文探讨了深度时间序列模型在各种分析任务中的设计,并从基础模块和模型架构两个角度回顾现有文献。原创 2024-08-02 01:03:56 · 460 阅读 · 0 评论 -
【论文译文】TIMEX++:利用信息瓶颈学习时间序列解释
解释操作在时间序列数据上的深度学习模型在许多需要从时间序列信号中获得可解释和透明洞察力的重要应用中至关重要。在本文中,我们从信息理论的角度研究了这个问题,并展示了现有的大多数可解释性度量可能会遇到琐碎解决方案和分布偏移问题。为了解决这些问题,我们引入了一个简单且实用的目标函数,用于时间序列可解释学习。目标函数的设计基于信息瓶颈 (IB) 原则,并修改 IB 目标函数以避免琐碎解决方案和分布偏移问题。原创 2024-05-20 12:17:13 · 927 阅读 · 0 评论 -
循环编码:一种用于时间序列特征的独热编码替代方案
将圆的右侧视为起点(在下面的图表中用0表示),或者在真实的24小时时间刻度上为00:00(凌晨12点),我们将其分为4个6小时的里程碑,以便能够将小时映射到圆上。时间序列特征在本质上是周期性的。通过这种方法,每个原始时间序列特征(例如一天中的小时、一周中的日期、一年中的月份)现在映射到只有2个新特征(原始特征的正弦和余弦)而不是24、7、12等个特征。例如,如果周期是一天,那么一天开始时的时间戳将被映射为0弧度,一天中间的时间戳将被映射为π弧度,一天结束时的时间戳将被映射为2 * np.pi弧度。原创 2024-05-04 12:15:27 · 952 阅读 · 0 评论 -
通用时间序列预测变压器的统一训练 Unified Training of Universal Time Series Forecasting Transformers
传统上,用于时间序列预测的深度学习在一个数据集对应一个模型的框架内运行,限制了其利用大型预训练模型带来的颠覆性影响的潜力。通用预测的概念源自于在大量时间序列数据集上进行预训练,设想了一个能够处理多样化下游预测任务的单一大型时间序列模型。然而,构建这样一个模型面临着特定于时间序列数据的独特挑战:i)跨频率学习,ii)适应多变量时间序列的任意数量,以及iii)解决大规模数据固有的不同分布特性。原创 2024-04-24 14:38:37 · 1230 阅读 · 0 评论 -
UniTS:构建统一的时间序列模型 UniTS: Building a Unified Time Series Model
基础模型,尤其是LLMs,正在深度学习领域发生深刻变革。我们可以通过少量提示或微调,将单个预训练模型适应于许多任务,而不是训练许多特定任务的模型。然而,当前的基础模型适用于序列数据,而不适用于时间序列,后者由于固有的多样性和多领域时间序列数据集、在预测、分类和其他类型任务之间存在差异的任务规范,以及对任务专用模型的明显需求,因此具有独特挑战。我们开发了UNITS,这是一个统一的时间序列模型,支持通用任务规范,适用于分类、预测、填补和异常检测任务。原创 2024-04-16 13:55:15 · 1791 阅读 · 0 评论 -
时间序列预训练模型 Chronos:学习时间序列的语言 Chronos: Learning the Language of Time Series
我们介绍了Chronos,这是一个简单而有效的预训练概率时间序列模型框架。Chronos使用缩放和量化将时间序列值标记为固定词汇,并通过交叉熵损失训练现有的基于Transformer的语言模型架构。我们在大量公开可用数据集上预训练了基于T5系列(参数范围从20M到710M)的Chronos模型,同时通过高斯过程生成了一个合成数据集,以提高泛化能力。在包含42个数据集的全面基准测试中,涵盖了传统的本地模型和深度学习方法,我们展示了Chronos模型:(a)在训练语料库中的数据集上明显优于其他方法;原创 2024-04-12 13:03:15 · 1097 阅读 · 0 评论 -
深度学习在时间序列数据异常检测中的应用:回顾、分析和指南 Deep Learning for Anomaly Detection in Time-Series Data: Review, Analys
随着工业自动化和连接技术的发展,各种系统持续产生大量数据。已经提出许多方法,从海量数据中提取主要指标以代表整个系统状态。利用这些指标在时间上检测异常可以预防潜在事故和经济损失。在多变量时间序列数据中检测异常具有特殊挑战,因为它需要同时考虑时间依赖性和变量之间的关系。最近基于深度学习的工作在这一领域取得了令人瞩目的进展。它们能够以无监督的方式学习大规模序列的表示,并从数据中识别异常。然而,大多数方法对于个别用例非常具体,因此需要领域知识来进行适当部署。原创 2024-04-07 13:12:56 · 955 阅读 · 0 评论 -
用于时间序列异常检测的深度学习:一项调查 Deep Learning for Time Series Anomaly Detection: A Survey
时间序列异常检测对于许多研究领域和应用至关重要,包括制造业和医疗保健。异常的存在可能表明新颖或意外事件,如生产故障、系统缺陷、心跳异常等,因此具有特殊的重要性。时间序列数据中的大规模和复杂模式促使研究人员开发了专门的深度学习模型来检测异常模式。本调查对时间序列异常检测的深度学习最新技术进行了结构化和全面的概述。它提供了基于异常检测策略和深度学习模型的分类法。除了描述每个类别中的基本异常检测技术外,还讨论了它们的优势和局限性。此外,本研究还包括了近年来各个应用领域中时间序列深度异常检测的示例。最后,总结了在将原创 2024-04-07 13:09:12 · 754 阅读 · 0 评论 -
一项关于图神经网络在时间序列中的应用的调查:预测、分类、填补和异常检测 A Survey on Graph Neural Networks for Time Series: Forecasting,
时间序列是记录动态系统测量值的主要数据类型,由物理传感器和在线过程(虚拟传感器)大量生成。因此,时间序列分析对于揭示可用数据中隐含的信息财富至关重要。随着图神经网络(GNNs)的最新进展,基于GNN的时间序列分析方法大幅增加。这些方法可以明确地建模时序和变量间的关系,而传统的和其他基于深度神经网络的方法则难以做到。在这项调查中,我们对图神经网络在时间序列分析中的应用进行了全面回顾(GNN4TS),涵盖了四个基本维度:预测、分类、异常检测和填补。原创 2024-04-07 13:06:51 · 767 阅读 · 0 评论 -
Time-LLM:为时间序列预测重新编程LLM 探索Time-LLM的架构,并在Python中将其应用于预测项目
我们将探讨Time-LLM的架构以及它如何有效地使LLM能够预测时间序列数据。然后,我们将实现该模型并将其应用于一个小型预测项目。原创 2024-03-11 08:32:36 · 4779 阅读 · 12 评论 -
TimesFM:Google的时间序列预测基础模型
TimesFM是谷歌的一款出色的时间序列模型,是时间序列基础模型类别中的重要补充。目前,该模型处于私人测试阶段,但谷歌计划在上提供该模型。但模型和训练数据集都尚未公开(谷歌仍在考虑是否开源该模型)。幸运的是,TimesFM论文比 Nixtla 的TimesGPT论文更具信息量 — 提供了许多关于基础预测模型的见解。尽管如此,时间序列基础模型的研究仍有很长的路要走,考虑到缺乏一个大型公共时间序列数据集。原创 2024-03-02 10:59:20 · 5394 阅读 · 0 评论 -
基于深度学习的时间序列预测:Temporal Fusion Transformer
TemporalFusionTTFT) 是一种基于Transformer的模型,利用自注意力来捕捉多个时间序列的复杂时间动态。我们可以在数千个单变量或多变量时间序列上训练TFT模型。模型输出一个或多个目标变量的多步预测,包括预测区间。TFT支持许多类型的特征,包括时间变量和静态外生变量。预测可以按照变量重要性和季节性进行解释。其中一个特点是独有的。我们将在下一节中介绍这一点。无疑是时间序列社区的一个里程碑。该模型不仅实现了SOTA结果,还提供了预测的可解释性框架。原创 2024-01-29 15:38:47 · 2737 阅读 · 0 评论