京东搜索商品隐式建模的理解

1 搜索广告CTR预估模型
在线广告,比如搜索广告都是搜索引擎,电商平台或者社交媒体平台重要的商业模式之一。在这里插入图片描述
上图就是一个典型的搜索广告模式,用户在产生一个query之后,会经过粗排,精排,重排阶段。每个阶段关注的侧重点也不相同,同时数据量级也是从上亿级别到最后的个十级别给用户展示。
2 CTR预估模型的发展

  • 目前整个行业来说,CTR模型的发展分两个方面,一个是在做特征优化,一个是在做模型结构优化;特征优化包括静态特征到动态特征,多模态特征,全域特征的引入;模型结构方面包括单模型到多模型的发展,不同领域模型的发展等。

3 上下文特征的应用

  • 说起上下文特征,第一个想起来的就是用户的点击行为序列,这个特征在推荐中发挥着非常重要的作用,可以获取用户的动态兴趣分布;
  • 在下面这篇论文中作者提出了一种新的上下文特征,作者因为点击行为序列可能会出现一些问题,比如冷启动问题,新用户点击行为序列不友好;行为序列过程的问题,会出现序列噪声的问题。
  • 基于此作者提出一种商品隐式的上下文特征,去解决上面提出的问题,论文链接如下:

论文链接

4 商品隐式建模
在这里插入图片描述
4.1 模型结构
模型结构分为三个部分,分别是:

  • select模块: 对候选的item做曝光概率建模
  • CIE模块: 将用户感知的所有Item做建模构成上下文特征
  • Backbone模块: 作为CTR预估模型的特征

4.2 select模块
在这里插入图片描述
该模块是根据用户粗排之后的所有Item去做建模,通过MLP的网络模型,最终得分每个Item的曝光概率;粗排的结果可能有上百个,那会对每个Item有最终的一个曝光权重;
4.3 CIE模块
在这里插入图片描述
该模块是本论文的最核心的模块,根据每个候选的Item,根据用户的感知去建模用户的上下文向量,这个模块的模型结构是典型的transformer结构。

  • transformer的encoder: 每个候选Item会有一个embedding,同时每个embedding会根据上一个select模块预估的曝光权重做一个相乘,作为本阶段的输入;
  • transformer的decoder: 本阶段是targer-attention模式,每个候选Item会根据target的结果动态调整每个候选Item的权重,最终得到一个用户的上下文Embedding。

4.4 Backbone模块
在这里插入图片描述
这个阶段是CTR的预估模型阶段,它可以加上一阶段建模好的上下文向量,也可以加入用户特征,query特征,商品特征等信息作为CTR预估模型的特征做建模,最终给用户做结果推荐。

4.5 损失函数
损失函数分两个部分: 点击率损失, select模块曝光概率损失
在这里插入图片描述
4.6 效果
在这里插入图片描述
论文的效果展示如上图,第一列是用户的query,第二列是用户点击的商品,第三列是CIE模块对粗排商品按照权重的排序结果,从左到右权重由高到低,我们可以看出前三个权重最高的商品不管从品牌,价格还是规格上都跟用户点击过的商品比较相似,而后三个明显效果就不好了。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值