elasticsearch分页获取数据

本文讨论了在Elasticsearch中使用`SearchResponse`进行搜索时遇到的`index.max_result_window`限制,介绍了scroll分页和searchAfter方法来处理大数据量搜索。同时,提到了Java开发者在提升技能时面临的挑战,分享了《2024年Java开发全套学习资料》资源链接。
摘要由CSDN通过智能技术生成

SearchResponse searchResponse = highLevelClient.search(searchRequest, RequestOptions.DEFAULT);

SearchHit[] searchHits = searchResponse.getHits().getHits();

for(SearchHit s:searchHits){

println(s.getSourceAsString());

}

}

但是上述方式有一个严重的缺陷:from和size不能太大,两者之和不能超过index.max_result_window,超过该值就会报

org.elasticsearch.client.ResponseException异常

Result window is too large, from + size must be less than or equal to: [10000] but was [11010]

为什么会使用index.max_result_window来限制搜索深度,因为这需要耗费大量内存,比如from为10000,es会按照一定的顺序从每个分片读取10010个数据,然后取出每个分片中排序前10的数据返回给协调节点,协调节点会将从所有分片节点返回的10条数据再次进行统一排序处理,以此来返回全局排序前10的数据,如果有类似的需要可以使用scroll以及search after来实现超大分页问题,

scroll分页示例代码可以参考:https://www.elastic.co/guide/en/elasticsearch/client/java-rest/6.8/java-rest-high-search-scroll.html

search after示例可以参考下面代码:

/**

  • search after

  • @throws IOException

*/

@Test

public void searchAfter() throws IOException{

SearchRequest searchRequest = new SearchRequest(“sub_bank1031”);

SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();

searchSourceBuilder.query(QueryBuilders.matchQuery(“cityId”, “511000”));

searchSourceBuilder.size(2);

//id动态映射为text类型,排序不能使用分词的字段,所以这里选择了id的keyword多字段属性

searchSourceBuilder.sort(new FieldSortBuilder(“id.keyword”).order(SortOrder.ASC));

//

searchRequest.source(searchSourceBuilder);

SearchResponse searchResponse = highLevelClient.search(searchRequest, RequestOptions.DEFAULT);

SearchHit[] searchHits = searchResponse.getHits().getHits();

if(searchHits.length >0){

for(SearchHit s:searchHits){

println(s.getSourceAsString());

}

JSONObject json = JSON.parseObject(searchHits[searchHits.length-1].getSourceAsString());

String id = json.getString(“id”);

searchSourceBuilder.searchAfter(new Object[]{id});

searchRequest.source(searchSourceBuilder);

searchResponse = highLevelClient.search(searchRequest, RequestOptions.DEFAULT);

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Java)

最后的话

无论是哪家公司,都很重视Spring框架技术,重视基础,所以千万别小看任何知识。面试是一个双向选择的过程,不要抱着畏惧的心态去面试,不利于自己的发挥。
同时看中的应该不止薪资,还要看你是不是真的喜欢这家公司,好了希望这篇文章对大家有帮助!

部分截图:
在这里插入图片描述

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

  • 14
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值