语义召回进阶之路：从传统到深度学习的搜索革新

最新推荐文章于 2024-07-03 14:40:36 发布

汀、人工智能

最新推荐文章于 2024-07-03 14:40:36 发布

阅读量1k

点赞数 6

分类专栏：搜索推荐系统相关技术业务落地方案及码源文章标签：深度学习人工智能向量搜索 milvus annoy 语义搜索搜索系统

涉及博主原创类文章，未经博主许可不允许转载

本文链接：https://blog.csdn.net/sinat_39620217/article/details/133887757

版权

搜索推荐系统相关技术业务落地方案及码源专栏收录该内容

79 篇文章 74 订阅 ¥239.90 ¥399.90

订阅专栏

语义召回在搜索技术中扮演关键角色，从传统倒排索引到深度学习模型的发展，显著提高了召回效率和效果。本文详细介绍了召回模型的三代进化，包括共享参数的孪生网络、负样本采样优化和正文信息融合等策略，同时探讨了面临的挑战，如实体缺失、特征漂移和正文信息建模。未来召回架构可能会趋向于弱化传统索引，更多依赖模型直接预测召回结果。

摘要由CSDN通过智能技术生成

语义召回进阶之路：从传统到深度学习的搜索革新

0.简介

召回技术是搜索方向的重要组成部分，大体上搜索架构都是以金字塔结构的形式组成，一般包括: 召回 -> 粗排 -> 精排 -> 重排序。召回位于整个金字塔的最底端，因此，召回效果的好坏直接决定整个搜索系统的天花板。传统的召回技术基于倒排索引的方式进行召回，这样的召回架构已经延续了很多年。传统召回技术具有召回效率高、召回结果匹配精准等优点，但传统召回在面对语义相似但字面不匹配等问题时却表现不佳，为了解决这类问题，业界已经在传统召回的路线上进行了很多优化，比如同义词替换或扩展、query 改写以及语义算分等，但是这些方式从本质上讲都是缓解该问题，并不能从根本上解决该问题。举个例子: Query: ”比喻说多了会露馅的句子 “，满足 Query 需求的结果:” 有句话的意思是话说多了就会漏出破绽“，我们通过上述的方法很难解决该类问题。近年来随着深度学习的发展，语义召回方向开始逐渐发展起来，这也让我们看到了彻底解决该类问题的希望，因此，我们在搜索中进行了语义召回的实践，经过一段时间的发展，语义召回已经在整个搜索中得到大规模的使用，并且对召回效果的提升起到了重要作用。

在本文中，我们将对搜索在语义召回的进阶之路进行展开介绍，详细阐述我们在通用搜索上如何进行召回模型的优化、当前语义召回仍然面临的问题以及我们对未来召回应该是什么样的等开放性问题抛出我们的想法，后续我们还会继续产出对语义召回上层排序模型进行优化和适配的文章。
整篇文章的组织结构如下:
1.召回模型的发展
2.语义召回面临的问题
3.未来召回架构畅想