搜索整体架构

最新推荐文章于 2024-01-13 09:01:05 发布

WitsMakeMen

最新推荐文章于 2024-01-13 09:01:05 发布

阅读量507

点赞数

文章标签：搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WitsMakeMen/article/details/131112540

版权

在这里插入图片描述

整体结构

搜索按照模块划分，整体分为三个主要部分，分别是离线数据挖掘、召回系统、排序系统。
离线数据挖掘负责离线商品等成分提取等功能，包括商品的实体词挖掘，类目预测，属性挖掘，以及商品title seo优化和网格拓品等。

索引召回

索引召回的主要目标是根据输入的query搜索词，然后经过词法分析、查询变换、短语分析、成分识别和线上应用等操作，将现有的query查询词经过分词和归一化，然后进行纠错和相似词变换等操作，对短语进行词权重赋权，然后进行成分识别，比如说识别出来核心产品词、品牌、属性等成分。最后通过构建召回语句和意图识别。
query理解完成之后呢，我们进行进一步召回，有基于倒排索引的召回，主要依赖于query查询理解里面的召回语法构建。然后是也可以基于双塔bert+dssm等深度模型的语义召回。或者通过用户query点击关系挖掘的，query个性化召回。

排序部分

排序部分有四个，相关性模块，粗排模型，配额模型，精排模型
相关性模块基于bert计算query和sku之间的相关性关系，用于进行后续的模型排序分层。
模型排序分为了粗排xgb模型，每个分层内部都有一个排序。
配额模型，主要对用户的多业态需求进行预测，预估用户的不同概率，用于粗排各业态数据截断。
精排模型分为了精排多目标模型，多目标模型主要结合多业态进行排序，每个业态都有自己的专家塔，专家塔有自己特有的属性特征。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
搜索整体架构

搜索按照模块划分，整体分为三个主要部分，分别是离线数据挖掘、召回系统、排序系统。离线数据挖掘负责离线商品等成分提取等功能，包括商品的实体词挖掘，类目预测，属性挖掘，以及商品title seo优化和网格拓品等。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

WitsMakeMen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。