语义召回进阶之路:从传统到深度学习的搜索革新

语义召回在搜索技术中扮演关键角色,从传统倒排索引到深度学习模型的发展,显著提高了召回效率和效果。本文详细介绍了召回模型的三代进化,包括共享参数的孪生网络、负样本采样优化和正文信息融合等策略,同时探讨了面临的挑战,如实体缺失、特征漂移和正文信息建模。未来召回架构可能会趋向于弱化传统索引,更多依赖模型直接预测召回结果。
摘要由CSDN通过智能技术生成

语义召回进阶之路:从传统到深度学习的搜索革新

0.简介

召回技术是搜索方向的重要组成部分,大体上搜索架构都是以金字塔结构的形式组成,一般包括: 召回 -> 粗排 -> 精排 -> 重排序。召回位于整个金字塔的最底端,因此,召回效果的好坏直接决定整个搜索系统的天花板。传统的召回技术基于倒排索引的方式进行召回,这样的召回架构已经延续了很多年。传统召回技术具有召回效率高、召回结果匹配精准等优点,但传统召回在面对语义相似但字面不匹配等问题时却表现不佳,为了解决这类问题,业界已经在传统召回的路线上进行了很多优化,比如同义词替换或扩展、query 改写以及语义算分等,但是这些方式从本质上讲都是缓解该问题,并不能从根本上解决该问题。举个例子: Query: ”比喻说多了会露馅的句子 “,满足 Query 需求的结果:” 有句话的意思是话说多了就会漏出破绽“,我们通过上述的方法很难解决该类问题。近年来随着深度学习的发展,语义召回方向开始逐渐发展起来,这也让我们看到了彻底解决该类问题的希望,因此,我们在搜索中进行了语义召回的实践,经过一段时间的发展,语义召回已经在整个搜索中得到大规模的使用,并且对召回效果的提升起到了重要作用。

在本文中,我们将对搜索在语义召回的进阶之路进行展开介绍,详细阐述我们在通用搜索上如何进行召回模型的优化、当前语义召回仍然面临的问题以及我们对未来召回应该是什么样的等开放性问题抛出我们的想法,后续我们还会继续产出对语义召回上层排序模型进行优化和适配的文章。
整篇文章的组织结构如下:
1.召回模型的发展
2.语义召回面临的问题
3.未来召回架构畅想

1.召回模型的发展

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汀、人工智能

十分感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值