双塔模型中的负采样

双塔模型广泛应用于推荐系统,本文介绍了CBNS(Cross-Batch Negative Sampling)策略,这是一种提高训练效率的方法,尤其适用于因GPU内存限制而无法使用大batch size的情况。CBNS利用编码器输出在训练后期的稳定性,通过历史item embedding作为负样本,减少对大batch size的依赖。实验表明,CBNS能有效提升模型性能,并且对负样本数量和memory bank大小的选择有明显影响。
摘要由CSDN通过智能技术生成

推荐模型中双塔模型早已经普及.一个塔学用户表达.一个塔学item表达.很多双塔模型用各种各样的in-batch负采样策略.十方也是如此.往往使用比较大的batchsize,效果会比较好,但是由于内存限制,训练效率会比较低.这篇论文《Cross-Batch Negative Sampling for Training Two-Tower Recommenders》发现encoder的输出在warming up的训练过程后就比较稳定了,基于此提出一个高效负采样的方法Cross Batch Negative Sampling (CBNS),该方法充分使用了最近编码过的item embedding来加速训练过程.

CBNS

关于问题定义就不赘述了,双塔已经写了很多了,计算用户与item相似度也是用简单的点积。loss最典型的就是用sampled softmax:

v2-fef496e54005e8bb13aeb75ae248092f_b.jpg

v2-8a7d8e74f2160541304d896101d6a1f8_b.jpg

提升训练效率,最好使的就是batch内负采样了,如下图(a)所示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值