【WSDM2024】 LLMs助力图学习？基于大模型的图数据增强

最新推荐文章于 2025-02-19 20:17:38 发布

数据派THU

最新推荐文章于 2025-02-19 20:17:38 发布

阅读量253

点赞数

文章标签：学习

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247625086&idx=3&sn=e08bf63c97aa967b08e920b3210b5207&chksm=e8c0a463d7e2d4fdcfb32af235104af462a55e30b06131a35a7bb27641623f68ec91372b9066&scene=126&sessionid=0

版权

作者提出LLMRec，利用LLMs进行异质图数据增强，针对推荐系统中的非交互和噪声问题，通过交互边、文本节点增强和用户画像提升，结合去噪机制，改善GNNs的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

来源：专知
本文为论文介绍，建议阅读5分钟
作者提出了三种基于LLMs的异质图数据增强范式。

今天给大家分享一篇香港大学Data Intelligence Lab发表在WSDM2024上oral presentation的论文：“LLMRec: Large Language Models with Graph Augmentation for Recommendation”。作者提出了三种基于LLMs的异质图数据增强范式，包括1)交互边的增强；2) 有基础文本信息的节点的增强；3) 无基础文本信息的节点的增强。这三种数据增强转化为推荐系统中的user-item交互图可以被看作是user-item交互的增强，item属性的增强，和user画像的增强。它们分别通过边(i.e.,1)和节点特征(i.e.,2，3)的助力了图学习。同时，关于图增强的去噪机制也被设计以确保增强的有效性和过程的鲁棒性。作者提供了理论分析以支撑基于LLMs的数据增强在解决推荐系统中non-interacted和noisy交互的问题。作者进行了与baseline的结果分析和消融实验以证明结果的有效性。

代码：https://github.com/HKUDS/LLMRec

以GNNs为encoder的推荐系统可以被看作是一个两阶段的过程，即，先进行graph embedding，然后接下来进行link predition任务。但是，长久以来推荐系统都被数据稀疏性困扰，user-item交互边的稀疏导致了link prediction的监督信号的稀缺，进而导致推荐结果的不准确。以往研究尝试将side information作为节点特征引入，以应对数据稀疏性的问题。然而，节点特征本身却也可能存在着诸多问题，比如side information的可得性，完整性和质量问题。这些问题可能不仅无法增强建模的过程，甚至可能损害最终下游任务的结果。

为应对上述问题，LLMRec提出了用LLMs辅助图学习的过程。LLMs以其出色的自然语言理解能力和丰富的知识背景为我们提供了解决上述问题的新机遇。因此，这篇工作以充分利用LLMs来协助图学习驱动的推荐系统。具体而言，LLMRec采用了三种基于LLMs的数据增强策略以增强依赖附加信息的推荐系统，这三种策略包括：i) 隐式反馈的增强，ii) 商品属性的增强，以及 iii) 用户画像的增强。这些策略不仅充分利用了数据集中的文本信息和LLMs的知识资源，还充分依赖LLMs在以图学习为基础的推荐系统中捕捉用户偏好的自然语言理解能力。此外，为确保增强数据的质量，LLMRec还引入了去噪机制，包括对i)的噪声边缘修剪和对ii)和iii)的基于MAE的特征增强。这一革新性的方法将LLMs与图学习相结合，为推荐系统的性能提供了新的突破口。