java 采集上下滚屏_RestHighLevelClient.scroll()实现滚屏

最新推荐文章于 2023-09-04 15:34:11 发布

清水荷叶粥

最新推荐文章于 2023-09-04 15:34:11 发布

阅读量559

点赞数

文章标签： java 采集上下滚屏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42300956/article/details/114610491

版权

本文展示了如何使用Java的RestHighLevelClient进行滚屏查询以避免大量分页导致的内存问题。通过设置Scroll，创建SearchRequest，然后进行循环遍历和清理ScrollID，以高效地获取大量数据。

摘要由CSDN通过智能技术生成

在ES中，分页查询当页数非常大之后，会很耗费集群的内存资源，可能会导致内存溢出等问题；所以当我们需要查询很多也数据的时候，选择使用scroll方式，下面是一个简单的demo:

引入依赖：

org.elasticsearch

elasticsearch

6.5.4

org.elasticsearch.client

elasticsearch-rest-high-level-client

6.5.4

BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();

boolQuery.should(QueryBuilders.termQuery("age","30"));

// 存活时间，当索引数据量特别大时，出现超时可能性大，此值适当调大

String index = "index";

Scroll scroll = new Scroll(TimeValue.timeValueMinutes(10L));

SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();

searchSourceBuilder.query(boolQuery);

searchSourceBuilder.size(500);

SearchRequest searchRequest = new SearchRequest()

// ES7已经去掉type，查询时加type

.indices(index)

.scroll(scroll)

.source(searchSourceBuilder);

SearchResponse searchResponse = null;

try {

searchResponse = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);

} catch (IOException e) {

e.printStackTrace();

}

String scrollId = searchResponse.getScrollId();

SearchHit[] searchHits = searchResponse.getHits().getHits();

for (SearchHit searchHit : searchHits) {

System.out.println(searchHit.getSourceAsString());

}

//遍历搜索命中的数据，直到没有数据

while (searchHits != null && searchHits.length > 0) {

SearchScrollRequest scrollRequest = new SearchScrollRequest(scrollId);

scrollRequest.scroll(scroll);

try {

searchResponse = restHighLevelClient.scroll(scrollRequest, RequestOptions.DEFAULT);

} catch (IOException e) {

e.printStackTrace();

}

scrollId = searchResponse.getScrollId();

searchHits = searchResponse.getHits().getHits();

if (searchHits != null && searchHits.length > 0) {

for (SearchHit searchHit : searchHits) {

System.out.println(searchHit.getSourceAsString());

}

}

}

//clean scroll

ClearScrollRequest clearScrollRequest = new ClearScrollRequest();

clearScrollRequest.addScrollId(scrollId);

ClearScrollResponse clearScrollResponse = null;

try {

clearScrollResponse = restHighLevelClient.clearScroll(clearScrollRequest,RequestOptions.DEFAULT);

} catch (IOException e) {

log.error("clear-scroll-error:{}",e);

}

boolean succeeded = clearScrollResponse.isSucceeded();

System.out.println(succeeded);

清水荷叶粥

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java 采集上下滚屏_RestHighLevelClient.scroll()实现滚屏

在ES中，分页查询当页数非常大之后，会很耗费集群的内存资源，可能会导致内存溢出等问题；所以当我们需要查询很多也数据的时候，选择使用scroll方式，下面是一个简单的demo:引入依赖：org.elasticsearchelasticsearch6.5.4org.elasticsearch.clientelasticsearch-rest-high-level-client6.5.4BoolQuer...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。