【推荐系统】DSSM双塔召回

最新推荐文章于 2023-08-28 15:56:57 发布

sdbhewfoqi

最新推荐文章于 2023-08-28 15:56:57 发布

阅读量2.4k

点赞数 4

分类专栏：推荐系统文章标签：机器学习深度学习数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31866177/article/details/115941316

版权

推荐系统专栏收录该内容

72 篇文章 19 订阅

订阅专栏

召回综述：【推荐系统】推荐系统主流召回方法综述

目录

一、DSSM概念

召回模型负例如何选择？

是否做Norm? (应用trick)

温度超参是什么？--> Loss要带温度超参

2.1. 美图架构图

2.2. 淘系架构图

2.3. 全民k歌架构图

一、DSSM概念

在推荐中的应用

1、输入层word hashing

2、中间层（常用的DNN模型）

3、匹配层

将doc和query（item和user）的embedding计算consine相似度，同时这是一个多分类问题，要使用softmax对匹配分数进行归一化，损失函数是交叉熵。

二、实践

三个实践经验决策点：

召回模型负例如何选择？
User Embedding和Item Embedding要做Norm? 要做，做了效果好。
Loss中相似性计算中要带温度超参么？

召回模型负例如何选择？

In-Batch 负例(Google DNN双塔)
全局随机抽样（Youtube DNN）
Mix{In-Batch负例+全局随机抽样}(Google)
Mix{In-Batch+曝光未点击}{我们19年做FM召回时的做法}

是否做Norm? (应用trick)

（1）对双塔两侧输出的Embedding进行L2标准化；

为什么要做Norm？增加训练稳定性以及线性可分性。

温度超参是什么？--> Loss要带温度超参

对于内积计算的结果，除以一个固定的超参。超参的设定可以通过实验结果的召回率或者精确率进行微调。除以超参的效果如下，可以看到Softmax的效果更加明显。

2.1. 美图架构图

美图个性化推荐的应用实践中DSSM召回线下训练，线上serving的整体架构图。

将用户最近点击，消费，转化等的数据采集后作为正样本；采样些全局最热但未点击(Youtube负采样套路)作为负样本构造样本训练DSSM模型进行推荐召回。

DSSM在预测的时候就可以借助Faiss进行异步物料向量更新，加载模型后可以根据实时用户行为进行ANN检索(求Topk相似向量)。

2.2. 淘系架构图

优化版本

特别说明：self-attention就是Transformer 序列建模。

2.3. 全民k歌架构图

双塔最终优化结构

优化方法

1、Softmax with Temperature

温度超参可以将Loss聚焦在Hard负例。

说明了：如果温度超参越小，则将Hard负例在投影空间从Anchor推开能量越大；
推论：召回模型的温度超参应该也是类似的作用，小的温度超参将优化过程自动聚焦到Hard负例；
推论：可以再思考下召回模型的随机负例，引入温度超参可能更重要：Easy Example vs Hard Example；
推论：使用温度超参，其实你不用专门去挖掘Hard Neg Example；

2、序列attention概念

无法直接用item信息来attention；
用稳定的行为去attention动态行为历史；
短期动态行为方差更大，attention可以帮助提取信息；

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【推荐系统】DSSM双塔召回

召回综述：【推荐系统】推荐系统主流召回方法综述一、DSSM概念在推荐中的应用1、输入层word hashing2、中间层（常用的DNN模型）3、匹配层将doc和query（item和user）的embedding计算consine相似度，同时这是一个多分类问题，要使用softmax对匹配分数进行归一化，损失函数是交叉熵。二、实践三个实践经验决策点：召回模型负例如何选择？ User Embedding和Item Embedding要做Nor
复制链接

扫一扫

专栏目录

sdbhewfoqi CSDN认证博客专家 CSDN认证企业博客

码龄9年

610: 原创

1万+: 周排名

1924: 总排名

109万+: 访问

: 等级

1万+: 积分

1215: 粉丝

756: 获赞

210: 评论

3235: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Python】多进程线程与CPU核数
ChitaWang: 请问博主，我用超算运行我的并行Python程序，因为我的数据有3万行，为了提高运行效率，我把Python代码改成了可以将原始数据分成200个子集同时并行的程序，是不是就需要再超算中申请200个进程数，每个进程需要1个核？因为我一开始申请的是1个进程，64个CPU核，速度和电脑一样，就很奇怪是不是我并没有真正地让超算并行起来？
【Python】通过字典映射调用方法
m0_60667384: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【推荐系统】召回与排序区别
一个学数学的程序媛: 候选池小根本不用做召回，可以直接排序。这句话貌似不对的样子，召回与排序应该还是有本质区别的把，比如召回就是区分正负样本，过滤掉用户必定不感兴趣的item，如果直接排序，就会导致推荐出了较多用户不是真正感兴趣的...纯个人理解，还想得到前辈的回应。
【hive】数据倾斜-大表小表join优化mapjoin
DataSience: 他是join，然后mapjoin中是小表就可以。如果是left 那就放前边
miniconda3安装window 无法pip
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。