Distillation based Multi-task Learning: A Candidate Generation Model for Improving Reading Duration

2021 腾讯看点
召回蒸馏多目标排序模型

问题:

  1. 许多标题党不能直接反馈用户喜欢点击的阅读内容,并且往往有比较高的pCTR,并且用户未必喜欢它
  2. 双塔模型不能直接建模多目标模型,所以需要蒸馏对MTL 进行学习建模
  3. 很少有论文讨论duration 建模,常用方法是通过回归对duration model 进行建模,对所有负样本duration 设为0,并使用均方差

为了提高用户体验,应该对阅读duration 进行建模

  1. 在点击的基础上继续学习duration
  2. 通过蒸馏将MTL teacher 知识学习到双塔student 当中
    在这里插入图片描述

样本
时长和点击是有依赖性的,点击un-clicked 可以为负样本,但是un-clicked 的样本在时长上如果当作0 处理的话,就和点击click-short duration 所一致了。并且点击label=0,时长label肯定=0(类似MMoE 了)

  1. 点击任务,正样本依旧是点击,而负样本是根据被点击的频率从所有item 中随机选择(与排序模型不同,排序模型是用点击作为正样本,展现未点击为负样本)
  2. 时长任务,duration > 50s(即所有duration 的中位数),其余为负样本

组成为:pCTCVR = pCTR * pCVR
在这里插入图片描述

Loss

腾讯 2021 看点推荐
teacher 模型Loss
典型ESMM loss
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

student 模型Loss(双塔)
为了尽可能拟合MMoE 的pCTCVR 的打分,那就用KL Loss 呗
在这里插入图片描述

总loss
在这里插入图片描述

为了避免train 阶段teacher model 受 student model 的影响,student model 的参数会与teacher model 参数分离,计算student 梯度的视后,会frozen teacher model

细枝末节

  1. 模型U2I 训练侧相似度度量方法为内积,构建向量索引也是根据内积

  2. Metric:AUC 正样本为 clicked-impressions duration > 50s,其它都是负样本。下面有个评估指标
    a. DSSM-Regression 通过duration 均方差进行训练,负样本 duration 为0
    b. DSSM-Classification:正样本为duration > 50s,其余为负样本,loss 为交叉熵
    c. DSSM-Click:正样本为点击,其余为负样本,loss 交叉熵(ctr 任务)
    在这里插入图片描述

  3. 在线A/B(用四个召回分支的平均阅读时间作A/B 指标对比是不是有点欠妥呢?其它指标如何关注,经典vv 换时长也可以达到这个效果,文章也没有详细讲明…)
    在这里插入图片描述

  4. teacher model:1024 × 512 × 256,expert=2(256 × 256)

  5. student model:512 × 256 × 128

  6. 建模时长的任务还是于二分类任务,用个中位数来切分,不太妥,非常影响后续生态的维护和分布

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值