论文阅读【时空+大模型】ST-LLM（MDM2024）

selia1078

已于 2024-07-12 15:51:51 修改

阅读量1.8k

点赞数 22

分类专栏：时间序列文章标签：论文阅读人工智能

于 2024-07-11 22:24:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/micaudience/article/details/140356174

版权

时间序列专栏收录该内容

2 篇文章

订阅专栏

论文阅读【时空+大模型】ST-LLM（MDM2024）

论文链接：Spatial-Temporal Large Language Model for Traffic Prediction
代码仓库：https://github.com/ChenxiLiu-HNU/ST-LLM
发表于MDM2024（Mobile Data Management）

本文主要面向交通流量数据。
在这里插入图片描述

符号定义

符号	含义
N	交通站点数
C	特征数量
P	历史序列长度
S	预测序列长度

Spatial-Temporal Embedding and Fusion

注： $X_P \isin R^{P*N*C}$ ，但在本文实验中C=1(原文“C = 1 represents the traffic pick-up or drop-off flow”)，因而有 $X_P \isin R^{P*N}$

一般而言，spatial-temporal embedding分为：

Token Embedding: $E_P = PointwiseConv(X_P) \isin R^{N * D}$
Temporal Embedding: $E_T = E_T^d+E_T^w = W_{day}(X_{day}) + W_{week}(X_{week})\isin R^{N *D}$
Spatial Embedding: $E_S = \sigma (W_S * X_P + b_S) \isin R^{N * D}$

然后将三种embedding合并：

$H_F = FusionConv(E_P||E_S||E_T) \isin R^{N*3D}$
其中’||'是拼接符号。

Partially Frozen Attention (PFA) LLM

这部分使用GPT2捕获时空依赖。Transformer Block中训练时空开销最大的是注意力（Attention）模块。本文使用了F+U个Transformer层：

在前F层中，Attention参数冷冻，只训练Layer Norm
在后U层中，Attention参数也用于训练
经过F+U个Transformer层后，得到的 $H^{F+U}$ 后，使用一个Regression Conv获得最终结果：
$Y_S = RegressionConv(H^{F+U}) \isin R^{S*N}.$

实验

交通预测

在这里插入图片描述

从这个实验结果来看，看起来很多后来的方法都比不上DCRNN？？？

效率

在这里插入图片描述

小样本/零样本（大模型必备）

在这里插入图片描述

博客等级

码龄5年

91
原创

194
点赞

319
收藏

129
粉丝

关注

私信

热门文章

分类专栏

时间序列 2篇
软件工程 3篇
计算机组成原理 2篇
BUAA 2篇
汇编语言 1篇
rails 1篇
web开发 2篇
博弈论 4篇
图论 3篇
codeforces 21篇
训练赛 18篇
辅助工具 1篇
训练表 2篇
android studio
字符串 7篇
动态规划 6篇
数据结构 5篇
数论 2篇
topcoder
计算几何 1篇
树 1篇
atcoder 1篇

展开全部收起

最新评论

论文阅读【时间序列】ModerTCN (ICLR2024)
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读【时空+大模型】ST-LLM（MDM2024）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读【时间序列】TimeMixer (ICLR2024)
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读【时间序列】DSformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【北航计组】P3 单周期CPU（施工中……）
waawawa: 请问能有偿求您帮我写logisim的CPU指令吗？是指令集上的

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。