论文的核心问题:
从未观测到的数据中提取高质量的负信号对有效利用纯正数据至关重要
提供更高质量的负样本进行推荐训练(即负样本中能提供更多的用户偏好信息)
论文的解决方法:
思路:就是在用户没有交互过的物品里找与交互过的物品相似度更高的作为负样本,这肯定比随机抽样直接作为负样本的效果更好
为什么呢?
既然相似但是用户却没有进行交互,那说明该样本一定的具有某些原因导致用户不进行选择(具体原因不需要探求)但是这样的负样本进行训练就更具有信息价值
如何去做的呢
构建两跳路径()
π=(e1,e2,⋯,eT),其中正例项目i是a_0 中的第一个节点;e_t是t步骤后的最后一个项目节点。在最后一步T上,以 e_T作为最终的负例来优化推荐器
(暴露给用户的可信度即很有可能被用户已经看到但是用户并没有选择,也就是可以看做负样本了,并且将e_t+1置信度设为负数)
通过强化学习来获得这样的一个e_T, 其中的reward包含两个部分:
这里解释为什么这么定义reward:整个采样器的前提一定是e_t没有与用户交互,但是它与用户的交互得分又很高,且又和交互过的项目很相似,那么它一定是一个高质量的负样本
得到负样本后,利用MF作为推荐方式进行推荐
如何利用知识图谱:
之前的一些基于KG的推荐只利用KG来设计更复杂的交互功能,从本质上提炼出更好的积极信号,而对消极信号却没有进行探索参考学习
我们假设用户行为和项目知识的知识图(KG)有助于从缺失的数据中推断信息和事实负面项目
将知识图谱与负采样相结合,从内隐反馈中发现高质量的负信号
在两跳范围内选择相关实体,需要利用知识图谱中的信息,可以聚合节点邻居信息表示节点。
1. https://blog.csdn.net/u013602059/article/details/107618136
2. https://blog.csdn.net/qq_41621342/article/details/105386876
3. https://blog.csdn.net/liweibin1994/article/details/79079884