【GCN-RS】Region or Global? A Principle for Negative Sampling in Graph-based Recommendation (TKDE‘22)

最新推荐文章于 2024-10-01 10:27:22 发布

chad_lee

最新推荐文章于 2024-10-01 10:27:22 发布

阅读量703

点赞数 2

分类专栏：论文解读图神经网络推荐系统文章标签：机器学习算法概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanguang1470/article/details/125903162

版权

GCN-RS论文提出在图基推荐系统中，负采样应选择用户周围中间区域的物品，以获取更具信息量的难样本。通过正样本辅助和曝光未点击的策略，生成负样本集合，并在embedding空间融合不同策略的负样本，以改进模型训练。采用margin hinge loss进行优化。

摘要由CSDN通过智能技术生成

Region or Global? A Principle for Negative Sampling in Graph-based Recommendation (TKDE’22)

中间区域

在这里插入图片描述

在GCN-RS里，负采样应该选取距离user中间的区域，太近的区域一般是用户聚合的物品，太远的没什么信息量，距离不远不近的样本可以看作是信息量比较大的难样本。

定义距离user k阶的物品是中间区域 $R_{m e d}$ ，可以用逐层广度优先搜索得到 $R_{m e d}$ 。

从中间区域 $R_{m e d}$ 选择 M 个负样本形成负样本候选集 $C_{u}$ ，然后从 $C_{u}$ 中用两种策略得到难负样本。

作者声称中间区域 $R_{m e d}$ 远小于整个物品集，但我在数据集上统计仅仅是3-hop，绝大部分 $R_{m e d}$ 几乎包含了整个数据集：
在这里插入图片描述

策略一：正样本辅助

类似于MixUp技术，为了得到user的难负样本，不仅仅和user $u$ 有关，还和user的正样本 $v$ 有关，对于一对正样本 $(u, v)$ ， $C_{u}$ 中负样本 $v_{n}^{p}$ 被采得概率为：
$p_{n}\left(v_{n}^{p} \mid(u, v)\right)=\frac{\sigma\left(\alpha\left(\mathbf{e}_{u}^{*} \cdot \mathbf{e}_{v_{n}^{p}}^{*}\right)+(1-\alpha)\left(\mathbf{e}_{v}^{*} \cdot \mathbf{e}_{v_{n}^{p}}^{*}\right)\right)}{\sum_{v_{i} \in \mathcal{C}_{u}} \sigma\left(\alpha\left(\mathbf{e}_{u}^$

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。