即插即用、简单有效的大语言模型推荐算法！港大联合百度推出RLMRec

PaperWeekly

于 2024-02-06 19:27:23 发布

阅读量917

点赞数 18

文章标签：语言模型推荐算法人工智能自然语言处理算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/136064447

版权

本文提出RLMRec框架，通过大语言模型优化推荐算法的表征学习，减少噪音影响。该框架引入文本信号，利用对比式和生成式对齐方法最大化互信息，提升协同过滤算法性能，已在多个数据集上取得显著效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文链接：

https://arxiv.org/abs/2310.15950

论文代码：

https://github.com/HKUDS/RLMRec

实验室主页：

https://sites.google.com/view/chaoh/group-join-us?authuser=0

TLDR

本文从互信息最大化的理论角度出发，通过引入文本信号以优化推荐算法的表征学习中存在的噪音，并且设计一套高效且无偏的基于大语言模型的用户/商品画像生成流程以提供优质的文本信号，最终通过基于对比式学习和生成式学习两套范式实现了互信息最大化的目标，在不同的任务场景下体现出了优势。

从有噪的表征学习说起

推荐系统已经成为互联网的一种基本服务，其通过学习用户历史交互行为中的偏好，向用户推荐个性化的商品。目前，基于图神经网络（Graph Neural Networks）的协同过滤算法在推荐领域体现出了巨大的优势。

一般来说，在协同过滤（Collaborative Filtering, CF）的场景下，我们拥有用户集合 U 和商品集合 I，以及他们之间的交互，那么如果我们将每一个用户和商品分别视为节点，并且将他们之间的交互记录视为边，就能够构造一个用户商品交互图（User-Item Interaction Graph）。

接着基于图神经网络的层层信息传递和聚合，我们可以最终得到每一个用户和商品节点基于图结构所学习到的表征，由于该表征包含了协同过滤的信息，因此我们可以称之为协同过滤特征表示（CF-side Representation）。

然而不可避免地，在用户和商品的交互图中存在着许多噪音（例如用户的误点击行为，用户购买过某商品之后发现并不喜欢等等情况），因此图上的某些边（交互）并不一定是正向的，即不能体现用户真正的购物偏好。

但是在模型优化的过程中，这些交互边任然会被视为是正样本，通过 BPR 损失对模型的参数进行优化，从而相关有噪的信息就被嵌入到图网络模型所学习到的表征中，因此最终变成了有噪的表征学习过程。

引入文本信号从理论上优化表征

如果没有额外的信息，仅仅依靠于用户-商品的交互图，想要挖掘出这些噪音边并且去掉是比较困难的，因此，我们考虑引入别的信号，即文本信号。

在这里我们首先对协同过滤特征表示

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。