相对于Ealsticsearch的search API, 翻页查询可以将查询结果集分页返回,而不是将所有的结果放在一个page返回。如果查询的结果集包含大量的数据,就可以用到翻页查询(Scroll) API,比如有200K条数据,可以将它们分成20次请求,每次只返回10k条查询结果. 有点类似于数据库里面的游标。
要使用翻页查询,需要在search请求中指定一个参数: scroll。这个参数是告诉elasticsearch要保留多久当前这个Search Context, 可以理解为Session 的keep alive。这样下次查询的时候只需要传递一个 scroll id就可以了。例如?scroll=5m (保留5分钟)。
要使用翻页查询,需要在search请求中指定一个参数: scroll。这个参数是告诉elasticsearch要保留多久当前这个Search Context, 可以理解为Session 的keep alive。这样下次查询的时候只需要传递一个 scroll id就可以了。例如?scroll=5m (保留5分钟)。
curl -XGET 'localhost:9200/twitter/tweet/_search?scroll=1m' -d '上面的请求的response里面会包含一个 _scroll_id,这个 _scroll_id必须加到下一次请求的body里面。 需要注意的是,每次新的查询必需用最近返回的 _scroll_id。
{
"query": {
"match" : {
"title" : "elasticsearch"
}
}
}
'