A Gain-Tuning Dynamic Negative Sampler for Recommendation
论文信息
title:A Gain-Tuning Dynamic Negative Sampler for Recommendation
link:http://playbigdata.ruc.edu.cn/dou/publication/2022_WWW_Negative_Sampler.pdf
from:WWW 2022
核心思想
- 现在的主流负采样思想是找困难负样本,但是这增加了采样到的负样本是假阴性的可能。这会导致模型难以收敛。
- 作者为了减少负采样到假阴性的可能,提出基于增益的动态负采样方法,去发掘真实的负样本。
- 为了进一步提升模型训练的效率,提出每个用户的正负样本组和交叉loss。
理论方法
基于增益的负采样器
-
首先作者期望发掘那些被曝光给用户,但是用户没有交互的样本,将此类样本作为真实负样本,所以自然的提出了曝光感知的衡量真实负样本的方法:
H t ( u , j ) = E i ∼ Δ u σ ( r u , j − r u , i ) \mathcal{H}^{t}(u, j)=\mathbb{E}_{i \sim \Delta_{u}} \sigma\left(r_{u, j}-r_{u, i}\right) Ht(u,j)=Ei∼Δuσ(ru,j−ru,i)- 公式计算的是期望, Δ u \Delta_{u} Δu是用户交互过的正样本集。
- 其中,其中𝑡代表训练阶段的第𝑡次迭代,𝜎是sigmoid函数。
- 括