在知识图谱中进行伪标记解决RS中的冷启动问题

发表于2021年WSDM

《Alleviating Cold-Start Problems in Recommendation through Pseudo-Labelling over Knowledge Graph》论文阅读笔记

待解决问题:对于推荐系统中的新用户和新项目,解决数据稀疏性问题是必要的。
目前的研究:大多将未观测到的样本视为负信号。
存在问题:经常将新项目作为负信号处理,可能会导致对已经流行的项目的结果产生偏差。
本文:基于图神经网络提出了一个知识图谱感知的推荐系统,通过伪标签来增加标记样本。通过模型预测(反映了从观察数据和KG中学习到的知识)为未观察到的样本分配伪标签。为了保证伪标签的可靠性,通过两种采样策略选择待标记的未观察项目。
(1) 知识图谱感知的项目伪标签采样;
(2) 负样本受欢迎程度感知的项目采样。
具体:
GNN在训练阶段,将有标签节点的特征利用知识图谱传播到未标签的节点。
知识感知的GNN:本文利用KG获得用户的喜好。首先建模用户特定的关系得分函数(度量用户每一种关系的重要性),然后进行层前向传播。
基于伪标签的半监督式学习:本文利用未观察到的用户目项对的高覆盖率来优化模型。通过预测未观察样本的标签来增加正负标签样本。
公式

采样要进行伪标签的项目,采样策略:
(1)在观察到的用户项目对上,基于图结构采样项目。对于可以通过元路径到达的项目(即基于用户在KG中交互的项目的路径),根据从观察样本中获得的知识为用户分配可靠的伪标签。
(2)负采样(将没有观察到的项目视为负样本,因此负采样更有可能选择冷启动项目),可以增强人们在实际环境中对受欢迎项目的偏见。
基础知识:
(1)知识图谱(节点表示实体,边表示实体之间的关系)是解决数据稀疏性问题的一种方法,但仍然会面临信息缺失的问题。传统的方法假设未观察到的样本为负样本。
(2)半监督式学习(SSL):在只有少量样本被标记的情况下,正确标记所有的样本(可被视为一个转化学习任务,在训练阶段,推断未标记样本(即用户项目对))。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值