AAAI 2025 | 基于LLM的推荐系统用户模拟器

作者:香港城市大学、吉林大学 张子健

今天跟大家分享一篇来自于吉林大学、香港城市大学、快手科技、西安交通大学在AAAI 2025联合发表的基于LLM的推荐系统用户模拟器。

用户模拟器能够快速生成大量实时的用户行为数据,为在线推荐系统提供测试平台,从而加速其迭代和优化。然而,现有的用户模拟器普遍存在显著的局限性,包括用户偏好建模不透明、无法评估模拟效果等。论文设计了一种由大语言模型驱动的推荐系统用户模拟器,以一种显式的方式模拟用户与商品的交互过程。 利用大语言模型的世界知识和推理能力,论文提出了一种逻辑模型实现用户商品交互模拟,并集成了统计模型提高模拟可靠性。与现有的基于大型语言模型的方案相比,该方法在推理阶段无需调用大型语言模型,既利用了其强大的推理能力,又避免了引入额外的时间开销和幻觉问题。 通过在多个数据集上进行的定性和定量实验,论文验证了该模拟器在各种推荐场景中的有效性和稳定性。

论文:https://arxiv.org/abs/2412.16984
代码:https://github.com/Applied-Machine-Learning-Lab/LLM_User_Simulator

1 研究动机

用户在线交互数据能够反映实时反馈和偏好,对持续优化推荐系统至关重要。然而,由于收集开销和隐私问题,获取真实用户的交互数据面临诸多挑战,因此有效模拟用户交互成为亟待解决的难题。用户模拟器可以快速生成交互数据,促进推荐系统的评估,同时保护用户隐私。

推荐系统用户交互逻辑

用户与商品的交互可以分为两个阶段:首先是认识商品,即了解商品的基本信息;其次是理解商品是否符合个人兴趣。以电影推荐为例,用户首先了解电影的类型,潜在的喜好或厌恶因素等客观信息;随后,用户从主观角度评估该电影是否符合自身兴趣,通常基于历史偏好或其他用户的评价。

本文的主要贡献可以被概括为以下三点:

  1. 分析用户与推荐商品交互的内在逻辑,在此基础上利用大语言模型分析商品特征并提炼用户偏好,提出一种推断用户交互行为的逻辑模型,为用户行为模拟提供了新的思路和方法。

  2. 构建了一个由基于规则的逻辑模型和数据驱动的统计模型组成的集成模型。结合了逻辑推理和统计学习的优势,能够更有效地模仿人类的交互行为。

  3. 在五个基准数据集上(POI、音乐、电影、游戏和动漫领域)进行了定性和定量实验。通过在多样化的数据集上进行实验,验证了所提出方法的有效性和稳定性。

2 方法

2.1 概述

基于用户商品交互逻辑,本文设计了一种基于大语言模型的用户模拟器,用于显式地模拟用户的交互过程(如下图)。具体而言,本文通过大语言模型分析商品,生成可能的喜欢或不喜欢原因,并总结为关键词。这些关键词既基于商品的客观描述,也来源于用户的评价文本,从而涵盖了商品的客观与主观特征。

在推理阶段,给定候选商品,模拟器会将其潜在的喜好/不喜欢原因与用户历史中相似商品的交互原因进行匹配,最终预测用户的交互结果。本文综合使用匹配度、相似度计算和传统统计模型,从逻辑与统计分析两个维度共同评估交互结果,以确保模拟的可靠性。

2.2 商品描述收集

商品描述收集是用户模拟器的基础,它为后续的用户偏好分析和交互模拟提供了必要的信息。 文章通过LLM对商品的事实描述进行分析,确定商品类别(),并挖掘用户喜欢()和不喜欢()的客观原因及相关关键词。通过设计特定的提示模板(如 )引导 LLM 生成全面且有针对性的描述,并采用思维链(CoT)方法提升输出质量,最后对提取的关键词进行筛选优化。 商品描述收集分为客观商品描述收集和主观商品描述收集两部分,两个过程使用的prompt如下图所示。

  • 客观商品描述收集:通过分析商品的事实性描述,确定商品的类别(如电影的类型),并从商品的基本信息(如名称、属性和类别)出发,利用LLM生成商品可能引起用户喜欢或不喜欢的客观原因。例如,在电影推荐中,LLM会根据电影的属性和类别,生成该电影的优缺点及其对应的证据和关键词。这些关键词和证据为后续的用户偏好分析提供了客观依据。

  • 主观商品描述收集:用户对商品的主观看法会受到公众意见的影响。因此,文章通过分析用户评论,提取出反映用户喜欢或不喜欢情感的关键词。具体来说,根据用户的评分和评论,LLM会生成与评分相对应的商品优点及其关键词和证据。

客观商品描述收集prompt

主观商品描述收集prompt

将客观和主观商品描述收集到的关键词合并,形成全面的商品描述,为用户模拟器提供了丰富的商品信息。

2.3 逻辑模型设计

逻辑模型是用户模拟器的核心,它基于用户与推荐项目交互的基本逻辑,模拟用户对候选项目的喜好或不喜欢。逻辑模型包括关键词匹配模型和相似度计算模型。

  • 关键词匹配模型:该模型专注于文本关键词的直接匹配。首先,从用户的历史交互项目中提取与候选项目相同类别的项目,然后分别提取出用户喜欢和不喜欢的项目集合。接着,计算候选项目的潜在喜欢/不喜欢原因与用户历史喜欢/不喜欢项目的原因之间的关键词匹配数量。通过比较匹配数量的多少,判断用户对候选项目的倾向。

  • 相似度计算模型:为了更细致地理解用户偏好,该模型利用嵌入表示来计算候选项目的优缺点与用户历史喜欢/不喜欢项目之间的相似度。具体来说,使用BERT等预训练语言模型将关键词转换为嵌入向量,然后计算候选项目的优缺点嵌入向量与用户历史喜欢/不喜欢项目的嵌入向量之间的余弦相似度。通过比较相似度的大小,进一步判断用户对候选项目的倾向。

2.4 统计模型引入

为了提高用户交互模拟的准确性和可靠性,文章引入了数据驱动的统计模型。该模型采用深度模型(如SASRec),在用户的历史交互数据上进行预训练,以捕捉用户行为的统计规律。预训练好的统计模型能够为用户模拟器提供一个基于数据的预测结果,增强模拟的稳定性。

2.5 集成模型构建

将上述关键词匹配模型、相似度计算模型和统计模型组合成一个整体的用户模拟器。在强化学习推荐系统训练中,根据三个模型的综合结果确定奖励函数(),以此来模拟用户在不同推荐场景下的行为反应。

3 实验

3.1 实验设置

数据集统计

文章选用 Yelp、Amazon Music、Amazon Games、Amazon Movie 和 Anime 等五个涵盖不同领域的数据集,将评分数据转换为二元格式(如评分≥3 记为 1,否则记为 0),以便于实验处理和分析。选用 ChatGLM - 6B 作为 LLM,并采用 A2C、DQN、PPO 和 TRPO 等具有代表性的强化学习算法进行实验,评估模拟器在不同算法环境下的性能表现。

3.2 实验结果

强化学习推荐系统性能比较

实验结果显示,DQN 算法在平均奖励、总奖励等关键指标上表现突出,优于其他强化学习算法。这主要归因于 DQN 算法在处理离散动作空间任务方面具有独特的优势,其能够更有效地估计每个动作的预期回报,并且通过经验回放和目标网络等技术进一步提升了性能。同时,各算法在推荐的喜好比例上均表现出较好的水平,这表明所提出的用户模拟器能够为不同算法提供稳定且可靠的交互环境,有效模拟用户的行为偏好。

3.3 Case study

以 DQN 算法在 Yelp 数据集上的推荐过程为例进行详细分析。在具体案例中,展示了组合模型中各个模型对推荐商品的推断细节,如对于某些推荐商品,关键词匹配模型()通过对比其与历史商品的关键词匹配情况给出相应的判断结果,相似度计算模型()则依据语义嵌入向量的相似度进行推断。特别在面对新类型商品时,虽然逻辑模型可能在精度上受到一定影响,但统计模型能够发挥其基于历史数据学习的优势进行补充,充分体现了组合模型的协同作用和优势。

4 总结与展望

文章提出了一种基于大型语言模型的用户模拟器,用于强化学习驱动的推荐系统。该模拟器通过明确建模用户偏好和交互逻辑,利用LLM分析项目特征和用户情感,构建了逻辑模型和统计模型相结合的集成模型,以高保真度模拟用户行为。

尽管用户模拟器在实验中表现稳定,但仍存在一些局限性,如目前仅能模拟二元的“喜欢”或“不喜欢”交互。未来的工作可以考虑整合更多的交互信号,如持续时间、评分和留存等,以进一步丰富用户模拟器的应用场景和提高其模拟精度


5 如何系统学习掌握AI大模型?

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

### AAAI 2025 Conference SAM Topic Details and Participation Information The AAAI 2025 conference, scheduled from February 25 to March 4, 2025, in Philadelphia, Pennsylvania, at the Pennsylvania Convention Center, offers a platform for researchers interested in various aspects of artificial intelligence, including specific topics like Segment Anything Model (SAM)[^2]. For those wishing to engage with or contribute research related to SAM within this prestigious event: #### Understanding SAM Contributions Segment Anything Model (SAM) has garnered significant attention due to its innovative approach towards segmentation tasks. Researchers aiming to present work on SAM should focus on advancements that push boundaries in image understanding and manipulation. #### Submission Guidelines To participate by submitting papers relevant to SAM: - Ensure submissions adhere strictly to formatting guidelines; using US letter size instead of A4 can prevent desk rejections as noted previously[^4]. - Papers must align closely with themes encompassing novel methodologies, applications, improvements over existing models, etc., specifically tied into how these relate back to SAM. #### Registration Process For attending the conference either physically or virtually: - Visit the official website linked through provided resources where registration opens closer to the date. - Early bird registrations often come with discounts so monitoring updates is beneficial. #### Networking Opportunities Engaging directly with leading experts who have contributed significantly to fields associated with SAM could provide invaluable insights. Attendees might find workshops, panels, poster sessions particularly useful for deepening knowledge about current trends surrounding SAM technologies. ```python # Example Python code snippet demonstrating basic usage of SAM model from segment_anything import sam_model_registry, SamAutomaticMaskGenerator, SamPredictor sam_checkpoint = "path/to/sam/checkpoint" model_type = "vit_h" device = "cuda" sam = sam_model_registry[model_type](checkpoint=sam_checkpoint) sam.to(device=device) mask_generator = SamAutomaticMaskGenerator(sam) image = cv2.imread('input_image.jpg') masks = mask_generator.generate(image) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值