论文笔记：How Can Large Language Models Understand Spatial-Temporal Data?

UQI-LIUWJ

已于 2024-07-06 11:17:37 修改

阅读量629

点赞数 2

分类专栏：论文笔记文章标签：论文阅读语言模型人工智能

于 2024-04-21 03:17:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40206371/article/details/138018225

版权

论文笔记专栏收录该内容

285 篇文章 74 订阅

订阅专栏

本文探讨了如何将大型语言模型（LLM）应用于时空预测任务，提出STG-LLM，通过STG-Tokenizer处理时空图数据并使用STG-Adapter进行轻量级微调，提升模型对复杂时空数据的理解和泛化能力。实验比较了监督学习和迁移学习的表现，以及进行了ablationstudy来验证设计的有效性。

摘要由CSDN通过智能技术生成

arxiv 202401

1 intro

LLM在NLP和CV领域表现出色，但将它们应用于时空预测任务仍然面临挑战，主要问题包括：
- 数据不匹配
  - 传统的LLMs设计用于处理序列文本数据，而时空数据具有复杂的结构和动态性，这两者之间存在显著差异
- 模型设计限制
  - 现有的时空预测方法通常需要为特定领域设计专门的模型，这限制了模型的通用性和适应性
- 数据稀缺和泛化能力
  - 传统的时空预测方法在面对数据稀缺或稀疏的情况下表现不佳，且泛化能力有限
- ——>论文提出了STG-LLM（Spatial-Temporal Graph-Large Language Model）
  - STG-Tokenizer
    - 时空图（graph）标记器（Tokenizer）
    - 将复杂的图数据转换为简洁的tokens，这些token能够捕捉空间和时间关系
  - STG-Adapter
    - 轻量级的适配器，包含线性编码和解码层，用于在LLMs和token化数据之间架起桥梁
    - 通过微调少量参数，使LLMs能够理解由STG-Tokenizer生成的token的语义，同时保留LLMs原有的自然语言理解能力

2 LLM+时空的几种可能方法

3 论文方法

使用的大模型是gpt2

4 实验

4.1 supervised比较

4.2 few shot 迁移能力

4.3 ablation study

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UQI-LIUWJ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。