KDD‘21 | 淘宝搜索中语义向量检索技术博客学习

最新推荐文章于 2023-08-29 14:35:21 发布

HxShine

最新推荐文章于 2023-08-29 14:35:21 发布

阅读量397

点赞数

分类专栏： nlp_paper nlp学习 nlp 文章标签：深度学习自然语言处理电商搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16949707/article/details/120355672

版权

nlp 同时被 3 个专栏收录

97 篇文章 3 订阅

订阅专栏

75 篇文章 7 订阅

订阅专栏

61 篇文章 2 订阅

订阅专栏

原文：

KDD’21 | 淘宝搜索中语义向量检索技术
https://zhuanlan.zhihu.com/p/409390150?utm_source=wechat_session&utm_medium=social&utm_oi=637963847940706304
作者微信公众号：
https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=MzU0MDA1MzI0Mw==&scene=124#wechat_redirect
作者知乎专栏：
https://www.zhihu.com/column/mgxs-note

概览

在这里插入图片描述

1. Motivation

基于词lexical matching的匹配召回缺乏对用户的历史行为进行建模，然后向量检索主要是对用户历史行为进行建模，平衡query语义和用户个性历史化行为之间的关系，感觉看到这就感觉有点虚啊，大部分应该都是直接语义相关吧，个性化不知道带来的提升能到达什么量级，这是已经很卷了是吗？

2. Solution

任务：根据实时行为，短期行为，长期行为和搜索的query来预测期望返回的top-k个候选物品。
网络结构图：其中query也利用了历史的搜索query数据，并结合了多粒度的词的信息。
词的信息的利用：
- query字面上的组织方式多样：字粒度，2-gram粒度，词粒度。
- query的表征方法多样：pooling，transformer，concat，addition等。
网络结构
商品总体召回框架

3. Evaluation

Recall@K
Pgood，top-k中有多少个结果和query强相关。
Numprank，有多少进入了后面的排序环节，证明相关性比较高。
GMV

4. 总结

特征：语义特征，行为特征融合
训练数据构建亮点：困难负样本构建
感觉短文本基于term的召回和基于lexical词的召回也比较重要啊。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
KDD‘21 | 淘宝搜索中语义向量检索技术博客学习

原文：KDD’21 | 淘宝搜索中语义向量检索技术https://zhuanlan.zhihu.com/p/409390150?utm_source=wechat_session&utm_medium=social&utm_oi=637963847940706304作者微信公众号：https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=MzU0MDA1MzI0Mw==&scene=124#wechat
复制链接

扫一扫

专栏目录

HxShine CSDN认证博客专家 CSDN认证企业博客

码龄10年

496: 原创

2万+: 周排名

3748: 总排名

123万+: 访问

: 等级

1万+: 积分

1299: 粉丝

459: 获赞

163: 评论

1573: 收藏

私信

关注

热门文章

分类专栏

最新评论

SpanBERT学习
忆_恒心: 这个span 是怎么处理的呢
5 python numpy.expand_dims的用法
啥都不会的熊猫: 怎么还用python2呢？
ICLR 2023 | Self-Consistency: Google超简单方法改善大模型推理能力
eyulin9218: 感谢大神，读完后受益匪浅！有一个小问题请教：做完marginalize之后，是否还是需要调用一次大模型，让它对marginalize的结果进行总结输出？否则的话不就只能得到最终的一个答案，而没有任何推理过程了？
MRC Framework for Named Entity Recognition【代码解读】
GG BoY: 你好，想问下这篇文章的代码不是香农科技的那个代码吧（https://github.com/ShannonAI/mrc-for-flat-nested-ner）我下载的代码跟你完全不一样
几种分割loss
weixin_42052476: 如果有很多中文分析各种损失函数的好处就好了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。