Reinforced Negative Sampling over Knowledge Graph for Recommendation
Xiang Wang, Yaokun Xu , Xiangnan He, Yixin Cao, Meng Wang, Tat-Seng Chua
National University of Singapore, Southeast University, University of Science and Technology of China, HeFei University of Technology
http://staff.ustc.edu.cn/~hexn/papers/www20-KGPolicy.pdf
在推荐系统中,适当的处理缺失数据具有一定的挑战性。
目前,大多数工作都会从未观测数据中进行负采样,进而能够训练带有负信号的推荐模型。但是,目前的负采样策略,无论是静态负采样还是自适应负采样,都无法得到高质量的负样本,这些负样本对辅助模型训练和反应用户真实需求方面的能力都有所欠缺。
这篇文章中,作出这样一个假设,即商品的知识图谱能够对商品和知识图谱实体之间提供比较丰富的信息,这有助于得到信息丰富和比较真实的负样本。
为此,作者们提出一种新的负采样模型,知识图谱策略网络(KGPolicy),以强化学习智能体的形式来探索高质量负样本。具体而言即为,通过设计适当的探索操作,该模型从目标正样本的交互中自适应接收带有知识的负样本信息,最终产生潜在的负样本商品来训练推荐模型。
将矩阵分解跟KGPolicy结合后,相对STOA采样方法(比如DNS和IRGAN)和利用知识图谱强化的推荐模型(如KGAT)取得了显著提升。
负采样主要可以分为三类
这三类侧重点的不同主要体现在以下方面
高质量负样本具有以下两个特点
负样本蒸馏图示如下
本文所提模型为
这篇文章的主要贡献有以下几点
下面是一些符号约定