推荐系统
文章平均质量分 90
Ckyeka
Code not merely for work, but for poetry and distant horizons.
展开
-
YouTube双塔模型——基于流数据的采样偏差修正
双塔模型通过采样负样本来优化损失函数,但是这种方式会受到采样偏差影响,影响模型性能,特别是在样本分布极度倾斜的情况下YouTube中的视频数据是流数据,新增的Item无法包含在固定的语料库,因此需要在batch中进行负采样并计算in-batch softmax从流数据中估计item的采样概率,并应用到采样偏差的修正上是改善模型性能的关键。原创 2024-03-31 22:37:37 · 758 阅读 · 0 评论 -
基于重要性采样的期望估计——sampled softmax推导
sampled softmax公式推导原创 2023-01-29 16:02:13 · 482 阅读 · 2 评论