论文笔记：Large Language Models for Next Point-of-Interest Recommendation

原创于 2025-06-08 11:25:25 发布

· 904 阅读

·

20

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语言模型 #人工智能 #自然语言处理

论文笔记专栏收录该内容

391 篇文章

订阅专栏

SIGIR 2024

1 intro

传统的基于数值的POI推荐方法在处理上下文信息时存在两个主要限制
- 需要将异构的LBSN数据转换为数字，这可能导致上下文信息的固有含义丢失
- 仅依赖于统计和人为设计来理解上下文信息，缺乏对上下文信息提供的语义概念的理解
——>使用预训练的大语言模型来进行推荐
- 允许在原始格式下保留异构的LBSN数据，从而避免上下文信息的丢失
- 能够通过包含常识知识来理解上下文信息的内在含义

2 方法

2.1 轨迹提示

当前轨迹块（current trajectory block）
- 当前轨迹块中只包含当前用户的一条轨迹，且不含最后一个签到点
历史轨迹块（historical trajectory block）
- 在当前轨迹块和历史轨迹块中，为每条签到记录生成一个句子
  - 对每条签到记录 𝑞 = (𝑢,𝑝,𝑐,𝑡,𝑔)，构造句子为：
    - 在 [time]，用户 [user id] 访问了 POI 编号 [poi id]，该地点属于 [poi category name] 类别，其类别 ID 为 [category id]。
    - 为节省 token 数量，没有将地理坐标（geo-coordinates）包含在句子中
    - 同时论文发现，未经特别地图数据微调的 LLM 无法很好地理解坐标信息
- 历史轨迹块则可以包含来自当前用户及其他行为相似用户的多条轨迹，以应对轨迹短和冷启动问题
指令块（instruction block）
- 指令块用于引导模型关注目标任务，并提醒 POI ID 的取值范围
目标块（target block）
- 目标块用于微调和评估阶段，包含要预测的签到记录（时间戳、用户 ID、POI ID），但在推理阶段不会作为输入
- 作者尝试将 POI 类别信息加入指令块和目标块，希望模型更关注 POI ID 与类别之间的关系，但实验显示效果提升不明显，可能模型已隐式学会这种关系。

2.2 键-查询对相似性计算

为了从用户历史轨迹及其他用户轨迹中挖掘行为模式，提出了适用于自然语言轨迹格式的键-查询对相似度计算框架
- 当前轨迹块中的轨迹被视为Key
- 所有结束时间早于该 Key 的轨迹被视为Query

计算所有 Key-Query 对的相似度，并从中选出与 Key 相似度较高的 Query，将其用于生成历史轨迹块内容
- 每个 Key 和 Query prompt 输入到 LLM 编码器中，提取最后一层的表示向量
- 对每组 Key 和 Query 计算余弦相似度，提取最高的top-k个Query

2.3 监督微调

在训练集中，将提示中的 <question> 部分送入预训练 LLM，而 <answer> 部分作为监督信号进行微调

LoRA+NormalFloat 4-bit量化+FlashAttention

3 实验

博客等级

码龄8年

1638
原创

5854
点赞

1万+
收藏

3621
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: LLM 笔记：Speculative Decoding 投机采样

下一篇：: 论文略读：Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Mul

最新评论

论文笔记：Urban Computing in the Era of Large Language Models
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：Large Language Models for Next Point-of-Interest Recommendation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：PMoE: Progressive Mixture of Experts with Asymmetric Transformer for Continual Learning
weixincloud: 这篇文章合理性存在质疑，1. 首先他施加了任务id监督gate的概率分布，先不说他能不能学习到极端的top1的路由概率，他放开的是全部专家，这意味着全部专家都会参与最终的输出，任务边界根本不可能明确 2.他浅层使用lora 尽管他说是r=4 但是增量任务这部分绝对会退化很严重，有效对齐的合理性遭到质疑 3.唯一的比较合理的点是 1%的历史数据缓解退化。
科研笔记 KDD 2025
weixin_44899585: 今年8月份还有投稿机会吗
论文笔记： Urban Region Embedding via Multi-View Contrastive Prediction
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UQI-LIUWJ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。