【文献阅读三】A Survey on Large Language Models for Recommendation

最新推荐文章于 2025-01-18 17:28:35 发布

爱学习的dog桑

最新推荐文章于 2025-01-18 17:28:35 发布

阅读量1k

点赞数 3

分类专栏：推荐系统阅读笔记文章标签：语言模型人工智能机器学习推荐算法自然语言处理

本文链接：https://blog.csdn.net/qq_45284304/article/details/134088828

版权

7 篇文章

订阅专栏

本文概述了大型语言模型在推荐系统中的应用，重点讨论了基于生成的推荐模型GLLM4Rec。文章介绍了两种模型范式及其训练方法，强调了LLM在推荐任务中的挑战和优化策略，如模型偏差、推荐prompt设计和评价问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文献来源：A Survey on Large Language Models for Recommendation
本文只是对原文章做的一个初步阅读与理解，如有错误的地方，还请多多指点。想了解更多请原读原文。

本文是关于推荐系统领域的一篇综述的阅读。为了提供一个关于LLM-based的推荐模型的全面了解，该综述将现存的模型分为两大范式：基于判别式的推荐模型DLLM4Rec和基于生成式的推荐模型GLLM4Rec。本综述重点讨论了GLLM4Rec。

迄今为止，已有少量研究对该领域的相关文献进行了综述。然而，这些主要集中在预训练语言模型中训练技术和策略的迁移，而不是探索基于LLM的方法。此外，他们缺乏对推荐领域中生成式大语言模型的最新进展和系统介绍的全面概述。

一、模型范式和分类

LLM Embeddings + RS：该范式将语言模型视为一个特征提取器，将物品和用户的特征输入LLMs并输出相应的嵌入。传统的RS模型可以利用知识感知的嵌入来完成各种推荐任务。
LLM Tokens + RS: 与前一种方法类似，该方法根据输入项目和用户的特征生成令牌。生成的令牌通过语义挖掘捕获潜在的偏好，可以集成到推荐系统的决策过程中。
LLM + RS：与第一种和第二种不同，该范式旨在将预训练的LLM直接转化为强大的推荐系统。输入序列通常由概要描述、行为提示和任务指令组成。期望输出序列能够给出合理的推荐结果。

总共分成两类，分别是DLLM4Rec和GLLM4Rec。而每一类又可以细分多个类别，具体参考上图。下图是对五种训练方法的详细解释。

fine-tuning: 微调的思想是采取一种语言模型，该模型已经从大规模文本数据中学习到了丰富的语言表示，并通过在任务特定的数据上进一步训练来适应特定的任务或领域。微调的过程包括用学习到的参数初始化预训练的语言模型，然后在特定于推荐的数据集上进行训练。该数据集通常包括用户-项目交互、项目的文本描述、用户画像以及其他相关的上下文信息。在微调过程中，模型的参数根据任务特定的数据进行更新，使其能够适应和专注于推荐任务。在预训练和微调阶段，学习目标可以不同。代表性的模型：U-BERT、UserBERT、BECR等等。
Prompt Tuning: 与通过设计特定的目标函数使LLM适应不同的下游推荐任务不同，提示微调试图通过硬/软提示和标签词在言语将推荐的调整对象与预训练的损失对齐。代表性的模型如Prompt4NR等。

与大多数基于判别模型的方法将LLMs学习到的表示对齐到推荐域不同，大多数基于生成模型的工作将推荐任务转换为自然语言任务，然后应用语境学习、提示调优和指令调优等技术对LLMs进行调整以直接生成推荐结果。

Non-tuning范式分为两类，Prompting和In-context Learning。

Prompting: 这类工作旨在设计更合适的指导语和提示语，帮助LLM更好地理解和解决推荐任务。这些策略已经被证明与基于项目的协同过滤方法相比具有显著的竞争力，特别是在接近冷启动的场景中。
In-context Learning: 上下文学习是GPT-3和其他LLMs用来快速适应新任务和新信息的一种技术。通过少量的示范性输入-标签对，他们可以预测一个看不见的输入的标签，而不需要额外的参数更新。然而，与提示相比，只有少数研究探讨了语境语言模型学习( Learning of Language Models，LLMs )在推荐任务中的应用。仍然存在许多开放性的问题，包括示范实例的选择以及示范实例的数量对推荐性能的影响。

LLMs有很强的零样本和少样本学习的能力，他们的表现比随机猜测要好。但是和传统的在具体数据集上训练出来的模型的性能还查一些距离。所以就有了fine-tuning、prompt tuning、和instruction tuning这三类。

fine-tuning: 在微调范式中，判别式和生成式大语言模型的使用方法明显类似。LLMs主要作为编码器来提取用户或项目的表示，LLMs的参数随后在下游推荐任务的特定损失函数上进行微调。然而，一个非常大的LM可能不会导致用户和项目的通用表示，简单的基于ID的协同过滤在温暖项目推荐设置中仍然是一种极具竞争力的方法。
prompt tuning: prompt tuning主要集中在特定的任务上，例如评分预测。在该范式中，LLMs通常以用户/物品信息作为输入，输出用户对物品的偏好(例如,喜欢或不喜欢,评分)，或者输出用户可能感兴趣的物品。比如GenRec和PBNR。
Instruction Tuning: 在该范式中，LLMs针对不同类型指令的多个任务进行微调。通过这种方式，LLMs可以更好地与人类意图对齐，并实现更好的零样本能力。如T5模型和M6模型。