Search API
现在让我们从一些简单的搜索开始。运行检索有两种基本方式:一种是通过REST请求URI发送搜索参数,另一种是通过发送他们的REST请求body。请求 body方法可以使您更具表现力,还可以使用更具可读性的JSON格式定义搜索。我们将尝试一个请求URI方法的示例,但在本教程的其余部分中,我们将仅使用请求body的方式。
可从_search
终端访问用于搜索的REST API 。本示例返回bank索引中的所有文档数据:
GET /bank/_search?q=*&sort=account_number:asc&pretty
让我们先分析一下search请求。我们正在搜索(
_search终端
)bank索引,并且该q=*
参数表示Elasticsearch匹配索引中的所有文档。sort=account_number:asc
参数表示使用每个文档的account_number
字段以升序排序。pretty
同样,该参数只是告诉Elasticsearch返回漂亮的JSON结果。
响应(部分显示):
{
"took" : 63,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : 1000,
"max_score" : null,
"hits" : [ {
"_index" : "bank",
"_type" : "_doc",
"_id" : "0",
"sort": [0],
"_score" : null,
"_source" : {"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244 Columbus Place","employer":"Euron","email":"bradshawmckenzie@euron.com","city":"Hobucken","state":"CO"}
}, {
"_index" : "bank",
"_type" : "_doc",
"_id" : "1",
"sort": [1],
"_score" : null,
"_source" : {"account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"amberduke@pyrami.com","city":"Brogan","state":"IL"}
}, ...
]
}
}
对于响应,我们看到以下部分:
took
– Elasticsearch执行搜索的时间(以毫秒为单位)timed_out
–告诉我们搜索是否超时_shards
–告诉我们搜索了多少个分片,以及成功/失败的搜索分片的数量hits
- 搜索结果hits.total
–符合我们搜索条件的文档总数hits.hits
–搜索结果的实际数组(默认为前10个文档)hits.sort
-结果排序键(如果按score排序则丢失)hits._score、
max_score
-现在暂时忽略这些字段
body请求方式:
GET /bank/_search
{
"query": { "match_all": {} },
"sort": [
{ "account_number": "asc" }
]
}
此处的区别在于,我们没有传递
q=*
,而是向_search
API提供了JSON样式的查询请求body。我们将在下一部分中讨论此JSON查询。
重要的是要了解,一旦返回搜索结果,Elasticsearch将完全完成请求,且不会维护任何类型的服务器端资源或在结果中展示游标。这与许多其他平台(例如SQL)形成了鲜明的对比,在SQL中,您最初可能会首先获取部分查询结果,然后如果要使用某种状态的服务器端游标来获取(或分页)其余内容,则必须连续请求服务器。