One Fits All: Power General Time Series Analysis by Pretrained LM

最新推荐文章于 2024-08-02 18:00:55 发布

Li_RuiQi

最新推荐文章于 2024-08-02 18:00:55 发布

阅读量1.7k

点赞数 27

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Li_RuiQi/article/details/135232882

版权

timeseries forecast

有些文章，需要科学上网

1.introduction

综述：

https://otexts.com/fpp3/what-can-be-forecast.html

Robust Time Series Analysis and Applications An Industrial Perspective | KDD 2022 Tutorial Qingsong Wen, Linxiao Yang, Tian Zhou, and Liang Sun

retail sales

https://www.vldb.org/pvldb/vol10/p1694-schelter.pdf

https://hub.hku.hk/bitstream/10722/45458/1/122119.pdf?accept=1、

missing data umputation

The Interpolation of Time Series by Related Series on JSTOR

…

详细看：文章One Fits All: Power General Time Series Analysis by Pretrained LM

时序数据：小于10GB[2105.06643] Monash Time Series Forecasting Archive

语言模型（LM）的训练数据多，可以训练大模型。用预训练的大语言模型，去做时序的下游任务。不仅能解决时序任务，数据量不够（甚至有时候没有标签数据）的问题。还能为时序的各种下游任务提供一个统一的框架，而不像之前那样，每个下游任务都要做定制化的设计。

self-attention模块经过（语言数据）预训练后，在没有（时序）数据的形况下，也能有很不错的表现。归因于self-attention与pca的“相关性”。泛化性

2.related work

分为模态内迁移学习与模态间迁移学习

通过预训练进行模态内的迁移学习
NLP领域最近聚焦于在下游任务中。上下文的词嵌入。

bert使用transformer编码器，并采用掩码语言建模任务，旨在恢复文本中随机遮蔽的tokens。

chatgpt在大语料集中训练transformer编码器并在特定任务数据集上进行微调。

gpt2 ：在更大的数据集上训练更多的参数，并且可以迁移到各种各样的下游任务上。

因为transformer的输入格式是很灵活的，对应的使用transformer预训练得到的模型也天然的可以适用各种各样（包括视觉）的任务。

DEiT：教师-学生策略，cnn做教师模式

BEit：把图像变为视觉的tokens，将bert应用到CV领域。

但timseries领域的训练数据还是太少，所以做的还是少。

跨模态的迁移学习

由于transformer输入的适应性，所以在不同领域的迁移学习也是个有趣的方向。

VLMo是CV领域的预训练模型，分阶段预训练策略，利用图像数据预训练冻结注意力模块，来训练语言专家。

Lu，研究了与从其他领域数据中学习到的端到端的transformer相比，冻结的预训练模型的强大性能。

Voice2series用语言处理模型做时序分类。

3.methodology

3.1 structure

在这里插入图片描述

frozen pretrained block ==> self-attention layers and FFN

子注意力层和前馈层可以保留大部分学习到的知识，所以在微调的时候，冻结这部分

positional embeddings and layer normalization ==> adopt to downstream tasks

为了适应不同的下游任务，位置编码和层间的标准化，可以参与微调。

input embedding == > cross the domain （modify the interface）

我们使用的预训练模型是语言模型，语言数据和时序数据是不一样的。所以需要修改输入的embedding让其符合模型的维度要求。

Normalazation

除了层标准化，还使用了数据标准化，反向实例标准

patching ==> optimize

通过聚合临近的时间步，来形成一个基于patch的token，从而提取局部的信息。这样可以明显增加每次输入的历史时间范围，但token的长度是不变的。

4.实验

时序分类，异常检测，缺失数据填补，长短时序预测，少样本或零样本预测。

baseline：

基于CNN的模型：TimesNet，

基于MLP的模型：LightsTS, DLinear

基于Transformer的模型：Refomer,Informer Autoformer,FEDformer, Non-stationary Transformer,ETSformer,PatchTST,

短期预测：N-HiTS N-BEATS

异常检测：Anomaly Transformer

分类：XGBoost Rocket, LSTNet, LSSL Pyraformer, TCN, Flowformer

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

5.Cost

在这里插入图片描述

6.self-attention connect PCA

数学公式看不懂

能看到实验，两个效果很像

在这里插入图片描述

关注

27
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
One Fits All: Power General Time Series Analysis by Pretrained LM

有些文章，需要科学上网。
复制链接

扫一扫

Li_RuiQi

CSDN认证博客专家 CSDN认证企业博客

码龄2年

中国科学院大学

31: 原创

104万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

564: 积分

455: 粉丝

228: 获赞

33: 评论

348: 收藏

私信

关注

热门文章

分类专栏

Bug 1篇
word小技巧 1篇

最新评论

故障诊断数据集（资源汇总）
Chenzhizzzccc: 找到了？
Frequency-domain MLPs
Li_RuiQi: 有时间可以安排一下. 具体有什么问题我们可以直接讨论。
Frequency-domain MLPs
爆焯丸子: 不知道作者是否跑通了这个代码，可否出一期博客讲解一下
Sim2Real两个源代码
思考实践: 这段代码定义了两个静态方法，用于处理图像和深度数据，以及生成点云，这些都是在机器人视觉处理和环境理解中常见的操作。 _bbox2mask方法：这个方法用于根据边界框（bbox）生成一个遮罩（mask），该遮罩在边界框内的区域为True，外部为False。参数image是输入的图像，bbox是边界框的坐标，格式通常为[中心点y坐标, 中心点x坐标, 高度, 宽度]。方法首先创建一个与输入图像第一个通道大小相同的零矩阵mask（假设图像是三维的，即宽x高x通道），数据类型为bool。然后，根据bbox的坐标，在mask上将对应的区域设为True，表示这部分是我们感兴趣的区域（即边界框内的区域）。最后返回这个遮罩。 base_cloud方法：这个方法用于将深度图转换为点云，并将点云数据与图像数据合并。参数image是RGB图像数据，depth是深度图数据，intrinsic是相机的内参矩阵，shift和end_pose是用于调整点云位置的参数（可能用于将点云从相机坐标系转换到机器人或世界坐标系中）。方法首先使用depth2cloud函数（这个函数没有在代码片段中给出，但其作用是根据深度图和相机内参生成点云）来将深度图转换为点云cam_cloud。然后，将点云数据cam_cloud（X, Y, Z坐标）和原图像数据image（R, G, B值）沿着最后一个维度（通道维度）连接起来，形成一个新的数据结构，其中包含了每个点的空间坐标和颜色信息。这两个方法展示了在处理机器人视觉任务时，如何从基本的图像和深度数据出发，进行遮罩生成和点云构建，以便进行进一步的分析和操作。
Sim2Real两个源代码
思考实践: 这段代码定义了一个名为 Solution 的类的初始化方法 (__init__)，用于设置和初始化一个机器人系统的各个组件以及一些相关的工作线程。以下是各部分的详细说明：初始化机器人硬件组件： self.arm = Arm(backend='ros')：创建一个机械臂对象，使用ROS（Robot Operating System）作为后端进行通信。 self.base = Base(backend='ros')：创建一个移动底座对象，也是使用ROS进行通信。 self.gripper = Gripper(backend='ros')：创建一个抓手（夹爪）对象，并随即打开抓手准备抓取物体。 self.camera = Camera(backend='ros')：创建一个相机对象，用于获取环境图像。初始化机器视觉组件： self.detector = Detector(model='grounding-dino')：初始化一个用于目标检测的模型，这里示例中使用的是grounding-dino模型。也提供了注释掉的选择，即使用yolo-v7模型。 self.segmentor = Segmentor(model='segment-anything')：初始化一个用于图像分割的模型，可以分割图像中的任何物体。 self.grasper = GraspPredictor(model='graspnet')：初始化一个用于预测抓取位置的模型，这里使用的是graspnet。初始化多线程和同步锁： self.image_lock、self.result_lock、self.prompt_lock：分别为图像数据、处理结果和提示信息创建锁，用于在多线程环境中同步访问这些资源。 self.running = True：设置一个运行状态标志，用于控制线程的运行。 self.prompt = 'sky'：初始化一个提示信息，这可能用于指导目标检测模型识别特定类型的物体。 self.update_once()：执行一次更新操作，可能用于获取初始的图像和处理结果。 self.t_vis = Thread(target=self.vis, daemon=True)：创建一个视觉显示的线程，用于实时显示图像和检测结果。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。