跟我学Elasticsearch(19) 分页搜索以及deep paging性能问题深度图解

1、分页搜索

语法

#搜索第1000页的10条数据
GET /test_index/test_type/_search?from=10000&size=10

2、什么是deep paging?

简单来说,就是分页搜索的特别深。比如有个index有3个primary shard,共60000条数据,每个shard上分了20000条数据。现在要进行分页查询取第1000页的10条数据。整个过程是这样的

(1) 分页查询请求打到协调节点,协调节点将搜索请求转发到index的3个shard所在的node上去

(2) 取出每个node上的第1~10010条数据返回给协调节点,协调节点一共拿到30030条数据

(3) 协调节点对这30030条数据进行排序,根据_score(相关度分数)取到排名最前的10条数据,就是我们要的最终的的第1000页的10条数据

3、deep paging性能问题

从上图可以看到,搜索的过深的时候,就需要在协调节点上保存大量的数据,还要进行大量数据的排序,排序之后,再取出对应的那一页。所以这个过程,即耗费网络带宽,耗费内存,还耗费cpu。所以deep paging会出现性能问题。我们应该尽量避免出现这种deep paging操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值