Reinforced Negative Sampling over KG for Recommendation

本文探讨了如何通过用户行为分析,利用相似但未被选择的项目作为负样本,结合知识图谱挖掘潜在的负反馈信息,以提高推荐系统的准确性。方法包括构建两跳路径并使用强化学习优化采样策略,最终通过MF模型实现个性化推荐。
摘要由CSDN通过智能技术生成

论文的核心问题:

 从未观测到的数据中提取高质量的负信号对有效利用纯正数据至关重要

提供更高质量的负样本进行推荐训练(即负样本中能提供更多的用户偏好信息)

论文的解决方法:

思路:就是在用户没有交互过的物品里找与交互过的物品相似度更高的作为负样本,这肯定比随机抽样直接作为负样本的效果更好

为什么呢?

既然相似但是用户却没有进行交互,那说明该样本一定的具有某些原因导致用户不进行选择(具体原因不需要探求)但是这样的负样本进行训练就更具有信息价值

如何去做的呢

构建两跳路径(e_{t}- e_{t}'- e_{t+1}

π=(e1​,e2​,⋯,eT​),其中正例项目i是a_0 中的第一个节点;e_t是t步骤后的最后一个项目节点。在最后一步T上,以 e_T作为最终的负例来优化推荐器

(暴露给用户的可信度即很有可能被用户已经看到但是用户并没有选择,也就是可以看做负样本了,并且将e_t+1置信度设为负数)

通过强化学习来获得这样的一个e_T, 其中的reward包含两个部分:

 

这里解释为什么这么定义reward:整个采样器的前提一定是e_t没有与用户交互,但是它与用户的交互得分又很高,且又和交互过的项目很相似,那么它一定是一个高质量的负样本

得到负样本后,利用MF作为推荐方式进行推荐

如何利用知识图谱:

之前的一些基于KG的推荐只利用KG来设计更复杂的交互功能,从本质上提炼出更好的积极信号,而对消极信号却没有进行探索参考学习

我们假设用户行为和项目知识的知识图(KG)有助于从缺失的数据中推断信息和事实负面项目

将知识图谱与负采样相结合,从内隐反馈中发现高质量的负信号

在两跳范围内选择相关实体,需要利用知识图谱中的信息,可以聚合节点邻居信息表示节点。

1. https://blog.csdn.net/u013602059/article/details/107618136

2. https://blog.csdn.net/qq_41621342/article/details/105386876

3. https://blog.csdn.net/liweibin1994/article/details/79079884

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值