RS推荐系统-DSSM双塔模型

最新推荐文章于 2024-04-22 15:13:09 发布

Mr.Wiggles

最新推荐文章于 2024-04-22 15:13:09 发布

阅读量718

点赞数

分类专栏：推荐系统文章标签：机器学习 python 深度学习推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Vihagle/article/details/121476738

版权

推荐系统专栏收录该内容

19 篇文章 3 订阅

订阅专栏

DSSM语义召回

DSSM是一种基于深度神经网络的语义建模方法，这是由微软发表的一篇关于Query和Doc的相似度计算模型的论文提出。

该模型的结构主要由三部分组成（如下图）

输入层

输入层主要负责将Query和Doc的数据转换成embedding向量表达，方法通常有TFIDF，One-Hot等。原论文针对英文输入提出了一种叫做Word hashing的特殊embedding方法来降低字典规模。

表示层

表示层主要是将初始的embedding向量，经过深度学习的方法映射得到Query和Doc的新的embedding向量表达，即上图中的 $New\ embedding$ 。

匹配层

匹配层是比较关键的一步，它将所获取的Query和Doc相互做余弦相似度运算，获得两两之间的语义相似度，注意此处的相似度结果不限输出范围，所以最后需要通过softmax把所有结果归一化，从而得到目标针对点击的正样本拟合P为1，反之拟合P为0。

总结

DSSM方法目前广泛运用于搜索、推荐等领域的找回和排序问题。双塔模型的最大特点就是user侧和item侧是两个独立的子网络，两个塔可以各自缓存，线上召回时只需要取出缓存中的向量做相似度计算即可。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
RS推荐系统-DSSM双塔模型

DSSM语义召回DSSM是一种基于深度神经网络的语义建模方法，这是由微软发表的一篇关于Query和Doc的相似度计算模型的论文提出。该模型的结构主要由三部分组成（如下图）输入层输入层主要负责将Query和Doc的数据转换成embedding向量表达，方法通常有TFIDF，One-Hot等。原论文针对英文输入提出了一种叫做Word hashing的特殊embedding方法来降低字典规模。表示层表示层主要是将初始的embedding向量，经过深度学习的方法映射得到Query和Doc的新的em
复制链接

扫一扫

专栏目录

Mr.Wiggles CSDN认证博客专家 CSDN认证企业博客

码龄4年

86: 原创

2万+: 周排名

2万+: 总排名

6万+: 访问

: 等级

964: 积分

3768: 粉丝

68: 获赞

39: 评论

302: 收藏

私信

关注

热门文章

分类专栏

最新评论

工作繁忙 + 想法枯竭 = 许久未更
Mr.Wiggles: 如果样本不平衡，可以通过降/升采样的方法去缓解样本分布，但是得注意的是，一味的采样使得平衡并不是最终解决方法，采样后的分布还得参照自然分布。比如正样本只占到TTL的0.01%，我们通过采样使其占比变成3%即可，而不是强行变成正负样本五五开，因为采样后样本的分布不能脱离自然分布（比如买彩票的概率本身就极低）
训练集（离线）与测试集（上线）效果差距很大怎么办？
Mr.Wiggles: 我觉得分两点来看： 1.你可以对比做/不做smote，对比两个测试集的recall有没有uplift，如果有说明smote对模型的是有提升的 2.其次，smote影响recall可能只是个充分非必要条件，还得看你的数据质量高低，特征维度是否全面。这些也会影响模型的精度上限
训练集（离线）与测试集（上线）效果差距很大怎么办？
不暴饮暴食好难啊: 楼主，目前我也在做离职预测，用smote方法来平衡样本，在训练集和验证集表现挺好的，但是在测试集上的recal效果不好，这种情况怎么处理提高我的recall呢
工作繁忙 + 想法枯竭 = 许久未更
不暴饮暴食好难啊: 亲，想了解对于不平衡的数据集进行预测的问题，样本分类极度不均，可能一万个样本里只有几十个正样本
如何解释模型预测？常用4种可解释性分析方法~
Mr.Wiggles: 你直接调用sklearn里面的boston房价数据集就可以啦

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.Wiggles 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。