自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 特征筛选方法总结

在训练过程中,一些不重要的特征的权重会逐渐减小到零,从而实现特征的自动选择。基于模型的特征重要性排序是一种利用模型自带的特征重要性评分机制来进行特征筛选的方法。例如,在决策树和随机森林等树形模型中,每个特征对模型预测的贡献可以被计算出来,从而得到特征的重要性排序。特征筛选是机器学习和数据分析中不可或缺的一环,其目的是从原始数据集中选择出最相关、最有代表性的特征,以提高模型的性能和效率。在特征筛选中,我们可以计算每个特征与目标变量之间的皮尔逊相关系数,来选择与目标变量最相关的特征。

2023-11-26 23:11:59 415

原创 时间序列相似度衡量方法汇总

时间序列相似度衡量是数据挖掘和机器学习领域中的一个重要问题,它关注于如何有效地比较和量化两个或多个时间序列之间的相似性。在时间序列分析中,准确地衡量序列之间的相似度对于模式识别、趋势预测、异常检测等任务至关重要。

2023-11-12 22:50:10 983

原创 【论文阅读】TabNet

TabNet是一种新的高性能和可解释的经典深度表格数据模型架构,继承了树方法的优点 (可解释性和稀疏特征选择),又继承了DNN的优点 (表征学习和端对端训练)

2023-11-05 20:52:20 258

原创 【论文阅读】Do We Really Need Deep Learning Models for Time Series Forecasting?

这是一篇探讨时间序列预测中是否需要使用深度学习模型的论文。在论文中,作者通过对传统预测模型和深度学习模型的比较,发现深度学习模型并不总是更有效,而且在某些情况下,传统模型如Gradient Boosting Regression Tree (GBRT) 可能表现得更好。该论文的贡献在于提供了一种新的视角来看待时间序列预测问题,并提出了一个有价值的比较研究,有助于指导实际应用中选择合适的模型。

2023-09-24 22:58:47 196

原创 安全库存算法

安全库存(Safety Stock)是指在供应链中为了应对需求不确定性而设立的一种库存策略。安全库存的目的是在需求超出预计的情况下,保证足够的库存来满足客户需求,同时避免因库存不足而导致的订单丢失和生产中断等问题。安全库存的计算方法通常基于历史需求数据和需求预测。

2023-09-03 23:03:05 748

原创 【论文阅读】CI-TSMixer

直接将MLP-Mixers使用到时序领域效果不佳,本文提出了TSMixer模型,TSMixer是patching-based,并且可以作为一个通用的backbone来用来学习时序的patch表征。

2023-08-27 22:45:48 537

原创 [论文阅读]SageFormer

多变量之间的关系是可以带来信息增益的,问题在于如何学习到各个变量的关系,将其有效的引入模型中,同时又能避免冗余的信息干扰模型训练过程。SageFormer解决了两个关键挑战:有效地表示系列中的不同时间模式并减轻序列之间的冗余信息。重要的是,所提出的系列感知框架与现有的基于Transformer的模型可以无缝集成,增强了它们对系列间依赖关系建模的能力。

2023-08-13 22:48:28 183 1

原创 Feature Programming for Multivariate Time Series Prediction

本文提出了一种新的方法来处理时间序列数据,这是一种按时间顺序排列的数据,比如股票价格或天气预报。以前的方法通常需要手动选择特征或设计特征来进行预测,但这样的方法很容易受到“噪声”的影响。本文提出了一种新的模型,能够更有效地处理这些噪声,并使用特殊的运算符来提取有用的信息。同时,本文还提出了一种特征编程框架,可以自动生成大量特征,提高预测的准确性。这种方法的优点是更具通用性和高效性,能够解决时间序列建模问题。

2023-08-06 22:43:10 148

原创 [读书笔记]机器学习模型调优指南

数据增强是一种常用的机器学习技术,可以帮助我们增加训练数据集的样本数量,填补数据集中的空白,提高模型的泛化能力和鲁棒性。在机器学习中,敏感性分析可以用于评估模型对输入数据的响应,确定哪些输入变量对模型的预测结果有更大的影响,以及发现模型的局限性和不足之处。同时,模型断言还可以帮助我们发现和纠正模型的潜在问题和错误,从而提高模型的质量和性能。当残差为零时,意味着模型预测是完美的。通过数据增强技术,我们可以生成更多的训练样本,从而帮助机器学习模型更好地学习数据的特征和模式,提高模型的准确性和泛化能力。

2023-07-09 23:08:43 189

原创 【论文阅读】Meta contrastive label correction for financial time series

股票趋势预测是一种通过对股票价格历史数据进行分析来预测未来股票价格走势的方法,价格走势通常会被分为三个类别:上涨、下跌和横盘。但是股票价格趋势预测通常面临这样一个问题:在预定义的标签规则下,很难准确地预测股票走势的方向。这是因为传统的标记方法,例如采用三重障碍法,通常会提供不准确甚至是有害的标签。为了解决这个问题,本文的方法能够自动为嘈杂的时间序列模式生成正确的标签,同时该方法能够提高此新标记数据集上的分类性能。

2023-06-18 23:10:58 120 1

原创 【论文阅读】SCNN - 模块化可解释的多元时间序列预测

这篇文章的核心是,利用因素分解的思路将多元时间序列预测问题模块化,并得益于分解和模块化建模方法,实现多元时间序列预测的可解释性建模。基础符号多元时序预测 Multivariate time series forecasting多元时序的生成过程 Generative process for multivariate time series假设整个多元时间序列的生成由下面4个等式而来,其中Z0是原始多元序列的表示,它可以拆解为上述4个模块,每个模块由一个scale因子σt∗σ_t^∗σt∗。

2023-06-11 22:21:07 318

原创 【论文阅读】The Capacity and Robustness Trade-off: Revisiting the Channel Independent Strategy for Multiva

多元时间序列预测问题中,从多变量建模方法的维度有两种类型,一种是独立预测(channel independent,CI),指的是把多元序列当成多个单变量预测,每个变量分别建模;另一种是联合预测(channel dependent,CD),指的是多变量一起建模,考虑各个变量之间的关系。

2023-05-21 23:07:28 316

原创 【论文阅读】2023-ICLR PatchTST

论文提出一种基于Transformer的多变量时序预测及自监督表示学习的模型。基于两个关键部分:(1)将时序分割成子序列级别的patch,作为Transformer的输入token;(2)通道独立性,其中每个通道包含一个单变量时间序列,该时间序列在所有序列中共享相同的Embedding和 Transformer 权重。

2023-04-16 21:24:00 917 1

原创 【论文阅读】2022-ICML FEDformer

论文提出了名为FEDformer的时序预测模型,通过在模型中结合季节趋势分解,以及利用傅立叶分析,在频域中使用Transformer,从而使模型更好的捕获时间序列的全局信息,进而取得更好的预测效果。

2023-04-09 21:45:14 849 1

原创 【论文阅读】2021-NIPS Autoformer

本论文主要探索长期时间序列预测,该问题对于模型的预测能力及计算效率有着很强的要求。论文提出了基于深度分解架构和自相关机制的Autoformer模型。通过渐进式分解和序列级连接,大幅提高了长时预测效果和效率。

2023-04-02 21:21:54 469 2

原创 【论文阅读】2022 Self-Supervised Contrastive Pre-Training for Time Series via Time-Frequency Consistency

在时序预训练任务中,面临一个难点,不同领域数据集不太好找到一个共同的先验假设,因为不同数据集的频率、周期性、平稳性差异都很大。这导致了在时序领域做预训练和迁移学习的难度。本文提出了一个基本假设:一个时间序列的频域表示和时域表示应该在时序表征隐空间中相近。基于这个假设,本文提出了Time-Frequency Consistency (TF-C)的自监督表示学习架构,综合考虑序列在时域和频域的表征,进而更好的进行预训练学习。

2023-03-26 19:47:35 662 1

原创 【论文阅读】2021 Informer

Transformer模型在长时间序列预测问题(LSTF)中存在计算量N方的问题,长序列输入的内存瓶颈问题,以及预测长输出时的训练速度的骤降问题。本问题提出了Informer模型来优化上述问题

2023-03-19 23:37:48 265 1

原创 【论文阅读】2022 N-HiTS: Neural Hierarchical Interpolation for Time Series Forecasting

本篇论文是N-Beats模型的改进,主要解决长时间序列预测有两个常见的难点,一是预测结果的波动性大,二是计算复杂度高。本篇论文在N-BEATS模型的基础上,提出了一种新的模型N-HiTS,通过引入Hierarchical Interpolation和multi-rate data sampling技术来解决上述两个问题。

2023-03-12 23:32:23 2252

原创 【论文阅读】2022 (LTSF-Linear) Are Transformers Effective for Time Series Forecasting?

论文提出了使用简单的线性模型来进行时间序列预测,效果超过了Transformer-based SOTA模型效果。长时序预测(LTSF)领域最近出现了很多Transformer-based 模型,由于Transformer是基于自注意力机制来有效提取长序列中成对元素之间的语义相关性的,在一定程度上具有permutation-invariant和anti-ordering的性质。而对于时间序列建模,主要是提取一系列有序且连续的点的时间相关性,因此顺序往往很重要。

2023-03-05 23:52:27 617 1

原创 【论文阅读】2023 MTS-Mixers

论文提出了MTS混合器,它使用两个因子化模块来捕获时间和信道相关性。在多个真实数据集上的实验结果表明,MTS Mixer以更高的效率优于现有的基Transformer的模型。

2023-02-26 22:55:45 2268 1

原创 【论文阅读】2023-ICLR:TimesNet

本文创新地将一维时间序列转化至二维空间进行分析,并进一步提出了任务通用的时序基础模型——TimesNet,在长时、短时预测、缺失值填补、异常检测、分类五大主流时序分析任务上实现了全面领先。

2023-02-19 22:55:47 921 1

原创 【论文阅读】NbeatsX

本篇论文扩展了NBEATS模型,通过包括外部变量来扩展其功能,并允许其集成多个有用信息源,由此产生的称为NBEATSx的方法。

2023-02-12 22:34:32 644 1

原创 【论文阅读】STFGNN

时空数据预测任务,尤其是交通数据,近来被广泛的学习,因为交通预测是ITS最重要的组成部分之一,对日常生活有着极大的影响时空数据结构在现实生活中也很有代表性:基于位置的数据例如风能站,天气监控站和发射塔等都可视为时空数据结构GNN在交通时序预测中已经取得了一些成绩,但是还存在以下缺点通过含不完全的邻接连接的空间图结构表示能力有限,限制了这些模型有效地学习时空相关性。通常使用单独的模块来实现空间和时间相关性,或者只使用独立的组件来捕获局部或全局的异质依赖关系的方法在处理复杂的时空数据时效果不好。

2023-01-08 22:51:44 226

原创 【论文阅读】N-BEATS

本论文贡献包含两部分:1. 深度学习架构:首次提出了没有运用精心设计的时序模块的纯DL模型,并取得了超过精心设计的统计模型的效果。证明了在时序预测任务上使用纯DL模型是可行的,并且加强了这一条路径的研究积极性。2. 面向时序任务的可解释DL:论文验证了可以通过类似传统的分解方法,例如“seasonality-trend-level”,精心设计模型结构,从而使其具有可解释性输出是可行的。

2023-01-02 23:03:25 1281 3

原创 【论文阅读】RevIN - Reversible Instance Normalization for Accurate Time-Series Forecasting Against Distrib

本篇论文提出的是一种数据规范化的方法,命名为“可逆实例规范化” (reversible instance normalization,**RevIN**)。具体来说,RevIN包含两部分,规范化和逆规范化,首先在数据输入模型前,将数据进行规范化,然后经过模型学习后得到模型输出,最后对模型输出进行反规范化。RevIN是一种灵活的,端到端的可训练层,能够被应用到任意模型层。

2022-12-25 23:06:56 4058 3

原创 【论文阅读】NSTransformers

本文是对论文NSTransformers的学习。论文提出了一种用于提升非平稳时序预测效果的模型架构,不仅考虑了非平稳数据的平稳化,还利用了非平稳信息来提升模型预测能力,并通过大量实验验证了效果。

2022-12-18 23:30:05 502

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除