论文研读 | 大模型时序应用——基于对比学习的时序数据embedding

最新推荐文章于 2024-06-15 20:07:27 发布

时空大数据小组

最新推荐文章于 2024-06-15 20:07:27 发布

阅读量1.8k

点赞数 17

文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ST_group/article/details/135690366

版权

北京大学和阿里巴巴合作的论文介绍了如何通过TEST方法，将时间序列任务与大型语言模型（LLM）结合，设计了一种TS嵌入策略，使LLM在TS分类和预测任务中表现出接近SOTA的能力，同时保留了语言模型的文本理解和多模态应用潜力。

摘要由CSDN通过智能技术生成

本文是由北京大学和阿里联合发布的大模型应用研究论文，总结了使用今天的语言模型（LLM）完成时间序列（TS）任务的两种策略，并设计了一种适合于LLM的TS嵌入方法——TEST——来激活LLM对TS数据的能力，在llm对TS分类和预测任务中达到了接近SOTA的能力，通过将LLM作为模式机器，让LLM可以在不影响语言能力的情况下处理TS数据。

TEST: Text Prototype Aligned Embedding to Activate LLM’s Ability for Time Series

Chenxi Sun, Yaliang Li, Hongyan Li, Shenda Hong(2023, August).

Peking University, Alibaba Group

1. 背景和问题

将时间序列（Time Series, TS）与LLM融合的方式有两条路线：

（1）LLM-for-TS：针对TS数据，从头开始设计并预训练一个基本的大型模型，然后为各种下游任务相应地微调模型；

（2）TS-for-LLM：基于现有的LLM，使它们能够处理TS数据和任务。不是创建一个新的LLM，而是设计一些机制来为LLM定制TS。

第一种方法是最基本的解决方案，因为预训练是向模型灌输知识的关键步骤。而第二种方法实际上很难超越模型的原始能力。囿于如下三个原因，本论文仍然关注第二种方法：

数据：TS通常为专业数据，难以大量获取；
模型：LLM-for-TS专注于垂直行业，跨领域需要重新建立，而TS-for-LLM可以插件化，几乎不需要训练，更加通用和方便；
用途：LLM-for-TS适合涉及专家的情况，TS-for-LLM保持了LLM的文本能力，同时提供丰富的补充语义，易于访问和用户友好。

基于预训练的LLM，如果将TS视为文本数据，可能的形式是：

[Q] 通过以下平均动脉压力序列（单位：毫米汞柱）判断患者是否患有败血症：88、95、78、65、52、30。

[A] 是的

然而，TS通常是多变量的，而文本是单变量的。处理单变量文本的LLM会将多变量TS转化为多个单变量序列并逐一输入它们。这样有三个缺点：

不同的prompts、顺序和连接语句会产生不同的结果；
长输入序列可能使LLM效率低下，难以记住前一个单变量TS；
TS中的多变量依赖性的关键方面将被忽略。

于是，本论文对TS进行了token化，设计了一个嵌入TS token的模型，并替换了LLM的嵌入层。核心就是创建能够被LLM理解的嵌入。

SOTA方法通过图像的文本描述来对齐文本嵌入和图像嵌入。但是TS缺乏视觉线索，并且存在标注瓶颈，只有少量TS，如ECG，适合转化为文本描述。自监督对比学习可以利用固有信息设计pretext任务，而不是依赖预先定义的先验知识，从而避免标注瓶颈。但是无约束对比学习生成的表示向量很可能与LLM的认知嵌入空间有很大的偏离。

本文提出Text embedding space of LLM (TEST)方法，在对比学习基础上，使用以正交文本嵌入向量为原型约束TS的嵌入空间，并通过识别特征原型来突出模式，激活LLM的模式机能力。

2. 方法介绍

Text emb

最低0.47元/天解锁文章

时空大数据小组

关注

17
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
论文研读 | 大模型时序应用——基于对比学习的时序数据embedding

Text embedding space of LLM (TEST)总共分为两步：（1）将TS token化，并训练编码器一个encoder，用对比学习表征TS tokens；（2）创建prompts，使LLM对表征更开放，并实现TS任务。
复制链接

扫一扫

时空大数据小组 CSDN认证博客专家 CSDN认证企业博客

码龄2年

17: 原创

130万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

322: 积分

113: 粉丝

97: 获赞

9: 评论

168: 收藏

私信

关注

热门文章

最新评论

KDD CUP 2022 风能预测赛题冠军方案分享
m0_59126798: 请问github上有代码分享吗
论文研读｜基于混合时空模型的地铁客流预测
CSDN-Ada助手: 恭喜您发布了第20篇博客！标题“论文研读｜基于混合时空模型的地铁客流预测”听起来就让人感到十分专业和有趣。您对混合时空模型的研究颇有深度，希望能够继续分享更多关于地铁客流预测的知识。或许在下一篇博客中，可以探讨一下实际应用中的挑战和解决方案，或者分享一些案例分析，让读者更好地理解这一领域的研究。期待您的下一篇精彩作品！
论文研读 | 大模型时序应用——基于对比学习的时序数据embedding
CSDN-Ada助手: 恭喜作者在论文研读方面取得新进展，对大模型时序应用进行了深入研究，尤其是基于对比学习的时序数据embedding。这篇博客内容丰富，对时序数据处理的方法进行了详细介绍，让读者受益匪浅。在接下来的创作中，我建议作者可以尝试将所学的理论知识与实际案例相结合，探索时序数据处理在实际应用中的具体效果和优势。同时也可以多和同行交流，获取更多的反馈和启发，不断完善自己的研究成果。期待作者在未来的创作中继续取得更多的进步和成就！
论文研读 | Anomaly-Transformer：基于关联差异的时间序列异常检测方法
qq_48948941: 博主 PSMSegLoader函数读取数据集在训练模式 __getitem__ 怎么返回测试数据集的标签搞不懂您可以解答一下啊吗谢谢您
基于双重图卷积注意力网络的个体移动预测
CSDN-Ada助手: 恭喜您在博客世界中发布了第15篇博文！标题“基于双重图卷积注意力网络的个体移动预测”听起来非常吸引人。您对个体移动预测这一领域的深入研究和探索给读者带来了很大的启发。我希望在恭维您的同时也能给出一些建议，希望能够激发您的下一步创作。在您下一篇博客中，或许您可以进一步讲解双重图卷积注意力网络的具体实现和应用场景，这将使读者更好地理解您的研究。同时，您可以考虑与其他领域的专家合作，探索如何将此方法应用于其他个体移动相关的问题。总之，感谢您的努力和持续创作！期待您未来更多精彩的博文。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。