推荐系统-召回阶段-双塔模型-2013:DSSM【通过双塔模型计算出User Embedding与Item Embedding,然后利用两者的相似度计算进行召回,可利用faiss进行加速计算】

本文介绍了DSSM(Deep Structured Semantic Models)在推荐系统召回阶段的作用,包括模型结构、离线训练和在线infer过程。强调了双塔模型的解耦特性,以及负样本构造的重要性和不同方法。DSSM由于无法使用user#item交叉特征,存在一定的局限性,但因其高效性在业界广泛应用。
摘要由CSDN通过智能技术生成

DSSM全称Deep Structured Semantic Models,是伊利诺伊大学厄巴纳-香槟分校(UIUC)与微软于2013年发表在CIKM上的。

DSSM在业界搜广推的影响力目前来说是超过前面介绍的任何一个模型,基本上统治了召回/粗排阶段

百度同样在2013年(那个年头的百度还处在如日中天的状态)搞了个双塔模型 SimNet,不过并没有发表相应的论文。


一、推荐中DSSM双塔模型结构

推荐领域中的DSSM结构一般如下图所示:

图1. 推荐领域常用DSSM模型结构

模型结果非常简单,主要包括两部分:user侧一个塔,item侧一个塔。user侧特征和item侧特征分别经过各自的DNN(一般情况下,两个DNN结构是一样的,当然也可以不一样)后得到user embedding和item embedding,这里需要注意的是如果你的user dnn和item dnn结构不一样,请无比保证输出维度一样,也就是最后一层全连接层隐藏单元个数相同,需要保证user embedding和item embedding的维度相同,因为下一步要做相似度计算(常用内积或者cosine)。损失函数部分则是常用的二分类交叉熵损失,y_true为真实label 0或者1,y_pred为相似度结果。

对于有经验的常年沉溺于挖特征(99%推荐/广告算法工程师的现状)的老司机,应该可以一年就看出DSSM模型的缺点:无法使用user#item的交叉特征。 这个问题我们在后面再探讨。<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值