KDD‘21 | 淘宝搜索中语义向量检索技术博客学习

75 篇文章 7 订阅
61 篇文章 2 订阅

原文:

  1. KDD’21 | 淘宝搜索中语义向量检索技术
    https://zhuanlan.zhihu.com/p/409390150?utm_source=wechat_session&utm_medium=social&utm_oi=637963847940706304

  2. 作者微信公众号:
    https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=MzU0MDA1MzI0Mw==&scene=124#wechat_redirect

  3. 作者知乎专栏:
    https://www.zhihu.com/column/mgxs-note

概览

在这里插入图片描述

1. Motivation

基于词lexical matching的匹配召回缺乏对用户的历史行为进行建模,然后向量检索主要是对用户历史行为进行建模,平衡query语义 和 用户个性历史化行为 之间的关系,感觉看到这就感觉有点虚啊,大部分应该都是直接语义相关吧,个性化不知道带来的提升能到达什么量级,这是已经很卷了是吗?

2. Solution

  • 任务:根据实时行为,短期行为,长期行为和 搜索的query来预测期望返回的top-k个候选物品。
    网络结构图:其中query也利用了历史的搜索query数据,并结合了多粒度的词的信息。

  • 词的信息的利用:

    • query字面上的组织方式多样:字粒度,2-gram粒度,词粒度。
    • query的表征方法多样:pooling,transformer,concat,addition等。
  • 网络结构
    在这里插入图片描述

  • 商品总体召回框架
    在这里插入图片描述

3. Evaluation

  1. Recall@K

  2. Pgood,top-k中有多少个结果和query强相关。

  3. Numprank,有多少进入了后面的排序环节,证明相关性比较高。
    在这里插入图片描述

  4. GMV
    在这里插入图片描述

4. 总结

  1. 特征:语义特征,行为特征融合
  2. 训练数据构建亮点:困难负样本构建
  3. 感觉短文本基于term的召回和基于lexical词的召回也比较重要啊。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值