大语言模型专题(15)YouTube推荐新范式——基于LLM的对话式推荐系统 - 知乎
论文核心
利用LLM构建对话推荐系统(CRS),增强推荐系统的可互动性和可解释性(传统推荐系统采用隐式指标,如点击率等)
解决问题
连接LLM和推荐引擎的桥梁 【在Retrieve阶段连接】
模型 | LLM | 推荐引擎 | 缺点 |
Generalized Dual Encoder Model(双塔模型) | 输出Context文本在LLM中的编码 | item embedding + KNN or ScaNN | 语义空间不匹配 |
Direct LLM Search | 物品的ID或标题 | 仅做搜索 | 对LLM端要求高 |
Concept Based Search | 从对话中提取的关键信息或话题(概念) | KNN相似度计算 | LLM概念提取可能造成文本有用信息损失 |
Search API Lookup | 查询Query | API调用 | API需要已经存在于业务中 |
文章的三大重点
- Retrieve:提出四种方式
- Ranking:分数 + 解释性文本
- User Profile的构建和更新:记忆化 + 触发/筛选机制 + 冲突解决
Retrieve (召回阶段:100物料)
- 修改的双塔模型【推荐算法】双塔模型介绍-CSDN博客
- Direct LLM Search
LLM直接输出要推荐的物品的ID或标题作为文本。使用搜索算法对语料库中的物品进行准确或模糊匹配,推荐引擎在这个过程中的作用仅限于进行简单的匹配操作。LLM必须学会通过其预训练和一个语料库特定的微调阶段输出这些物品的ID或标题。缺点是对LLM模型端的训练要求大
- Concept Based Search
LLM输出一组概念(代表了从对话中提取的关键信息或话题),推荐引擎将这些概念嵌入并聚合为单一的上下文嵌入。这个上下文嵌入通过近似最近邻搜索与物品相关联。概念列表的生成是通过在LLM中学习或微调中获得的,这使得LLM能够通过自然的任务(提取对话中的关键概念)来学习语境。与第一个模型相比,这个方法更注重从对话中提取的语义概念。
- Search API Lookup
LLM生成的是搜索查询 query,随后利用已经存在于业务中的搜索 API 来获得推荐内容
Ranking 排序
图来自:大语言模型专题(15)YouTube推荐新范式——基于LLM的对话式推荐系统 - 知乎
LLM依次推理项目与上下文的匹配程度,并为其决策生成可解释性的文本(作为副产品)
排序模块不需要在大型语料库上执行可处理的搜索,因此在可能的计算类型方面受到的约束较小。并可能在直接比较候选项目的训练过程中使用自定义排序损失