【GCN-RS】Region or Global? A Principle for Negative Sampling in Graph-based Recommendation (TKDE‘22)

GCN-RS论文提出在图基推荐系统中,负采样应选择用户周围中间区域的物品,以获取更具信息量的难样本。通过正样本辅助和曝光未点击的策略,生成负样本集合,并在embedding空间融合不同策略的负样本,以改进模型训练。采用margin hinge loss进行优化。
摘要由CSDN通过智能技术生成

Region or Global? A Principle for Negative Sampling in Graph-based Recommendation (TKDE’22)

中间区域

在这里插入图片描述

在GCN-RS里,负采样应该选取距离user中间的区域,太近的区域一般是用户聚合的物品,太远的没什么信息量,距离不远不近的样本可以看作是信息量比较大的难样本。

定义距离user k阶的物品是中间区域 R m e d R_{m e d} Rmed,可以用逐层广度优先搜索得到 R m e d R_{m e d} Rmed

从中间区域 R m e d R_{m e d} Rmed选择 M 个负样本形成负样本候选集 C u C_{u} Cu,然后从 C u C_{u} Cu中用两种策略得到难负样本。

作者声称中间区域 R m e d R_{m e d} Rmed 远小于整个物品集,但我在数据集上统计仅仅是3-hop,绝大部分 R m e d R_{m e d} Rmed 几乎包含了整个数据集:
在这里插入图片描述

策略一:正样本辅助

类似于MixUp技术,为了得到user的难负样本,不仅仅和user u u u有关,还和user的正样本 v v v 有关,对于一对正样本 ( u , v ) (u,v) (u,v) C u C_{u} Cu中负样本 v n p v_{n}^{p} vnp被采得概率为:
p n ( v n p ∣ ( u , v ) ) = σ ( α ( e u ∗ ⋅ e v n p ∗ ) + ( 1 − α ) ( e v ∗ ⋅ e v n p ∗ ) ) ∑ v i ∈ C u σ ( α ( e u ∗ ⋅ e v i ∗ ) + ( 1 − α ) ( e v ∗ ⋅ e v i ∗ ) ) p_{n}\left(v_{n}^{p} \mid(u, v)\right)=\frac{\sigma\left(\alpha\left(\mathbf{e}_{u}^{*} \cdot \mathbf{e}_{v_{n}^{p}}^{*}\right)+(1-\alpha)\left(\mathbf{e}_{v}^{*} \cdot \mathbf{e}_{v_{n}^{p}}^{*}\right)\right)}{\sum_{v_{i} \in \mathcal{C}_{u}} \sigma\left(\alpha\left(\mathbf{e}_{u}^

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值