京东的商品搜索功能是如何实现的_京东亿级商品搜索排序规则技术全面公开

本文介绍了京东商品搜索引擎的架构,包括爬虫系统、离线信息处理系统、索引系统和搜索服务系统。系统支持高并发和个性化搜索,通过多级缓存策略、截断策略和均匀分片策略提高性能。未来,京东搜索将探索场景搜索和图像搜索等新功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目前京东整体搜索引擎是搜索部门推荐部自主研发的商品搜索检索引擎,主要功能室为了亿万级别的海量京东用户提供有效的精准,得到快速的购买体验。主要有电脑端/移动端/微信端/手Q端口的搜索页面、移动列表页、店铺搜索、店铺列表等。虽然这套系统只有短短三四年时间,系统已经能够支持很大的PV过亿的请求回执,并且经过了多次618周年庆和双十一的考验验证。

与大众在日常使用的百度、谷歌等大的搜索引擎(或称为“全文搜索引擎”)相比,京东的商品搜索库引起与前者有很多相同之处,比如“覆盖掉海量数据”、“超高的快速查询”以及“超快速的请求回执响应时间”,同时又是自身显著地业务特点。

  • 搜索结构化的商品数据,需要从商品系统,库存系统,价格系统,促销系统,仓储系统等多个数据库进行抽取相关数据;
  • 通过快速和极其高效的召回率要求,保证每一个状态都可以保证被搜索捡取到商品,(除去系统问题的情况);
  • 商品库的信息室及时更新,目的是保证京东用户提高最佳的购物体验,——比如不能给用户展示出下柜的商品,或者商品的实时价格超出了用户搜索限定的范围。这就要求我们的搜索引擎要做到和各个系统的信息时刻保持同步,目前每天更新次数过亿;
  • 逻辑性质复杂的商品体系业务,需要存储量的商品属性信息室倒排索引的信息两倍之多;
  • 用户购物的个性化需求,要求系统实现用户标签与商品标签的匹配。

正是由于既要兼顾大搜索引擎的通用需求,同时要契合京东的业务特点,我们将系统架构分为四个部分:1. 爬虫系统、2. 离线信息处理系统、3. 索引系统、4. 搜索服务系统。

为了使各位学者能够很深入了解京东系统商品搜索引擎的架构体系,今天本文就给大家首先介绍了商品的搜索的总体架构体系,然后依次给大家介绍京东的爬虫系统、离线信息处理系统各个系统模块,并且对京东搜索技术的最新研究方向做一些展望的工作,希望对各位学者有很多大收获和帮助。

京东商品搜索引擎的整体架构如下图所示:

06104a824cd7dfaa503d43bf113efd96.png

从上到下共分为3层:

1.京东搜索最上层是有搜索的前端UV层面,负责整体的京东搜索展示页面效果。

2.中间层面是有京东搜索索引服务、SUG搜索、相关搜索、分词服务和兜底部服务组成。其中SUG搜索提供搜索输入框提示功能;相关搜索提供与query相关的其他搜索词服务;划词服务提供去除query部分词的功能;兜底服务用于索引服务异常情况下提供托底,保证用户基本的搜索可用。

3.最下层是索引生产端,主要功能是对接商品、库存、价格、促销、仓储等众多外部系统,整合相关数据生产全量和增量数据的索引,为在线检索服务集群提供全量索引和实时索引数据。

商品搜索引擎的最核心是建立的商品的检索页&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值