【广告推荐】用户行为序列建模(DIN、SIM)

一、用户行为序列建模

  • 用户行为序列特征加到 召回、粗排、精排,都会有收益

1.1 普通多目标排序模型

下面是普通的多目标排序模型
在这里插入图片描述

1.2 用户的 lastN 行为序列

  • 这里重点关注 “用户特征” 中的 lastN 行为序列,也就是用户最近交互(曝光、点击、转化等等)过的 N 个物品序列(物品id序列、物品类目序列)
  • 做embedding:把N个物品id映射成N个向量,最后对向量取平均得到一个向量,这个向量可以作为用户的一种特征,表示用户过去对哪些物品感兴趣

在这里插入图片描述
在这里插入图片描述

1、小红书实践

  • 把点击、点赞、收藏等不同行为的 最终的多个向量 cancat 起来,作为用户特征
  • 在取lastN的时候,不仅会使用物品id,还会使用物品类目,把物品id emb和其他特征的emb拼起来,比只用id emb的效果更好
    在这里插入图片描述

二、DIN 模型

  • DIN 也是对 lastN 行为的一种建模方法,优于上面一节简单对 各个emb取平均
    在这里插入图片描述

  • 计算相似度的方法,如 cos、内积

  • 最终的 emb 是由各个 lastN 向量 加权得到的,权重是 各个lastN物品 & 候选物品的相似度 alpha
    在这里插入图片描述
    在这里插入图片描述

  • DIN 的本质是注意力机制
    在这里插入图片描述

  • 简单平均 & 注意力机制的 区别
    在这里插入图片描述

三、SIM 模型

  • 主要目的是保留用户的长期兴趣

3.1 DIN的缺点

  • 如果加长 DIN 的序列长度,是可以提高AUC的,但是也会显著增加计算,总的ROI不高

在这里插入图片描述

3.2 改进 DIN(SIM)

在这里插入图片描述
在这里插入图片描述

1、查找

在这里插入图片描述

2、注意力机制

  • 和DIN没有本质区别,主要区别是 lastN 变成了 topK

  • 上面 第一步的查找,把lastN物品缩小到 topK,排除掉的物品大概率和候选物品无关(相似度很低),排除之后几乎不会影响加权平均的结果
    在这里插入图片描述

  • 重要 trick:使用时间信息
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

参考

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值