ElasticSearch查询,在大多数情况下,查询将被分散到多个节点中,得到结果,合并,再获取有关文档返回结果。
ES 定义查询行为的还有:查询重写、搜索类型和查询执行偏好。
默认查询逻辑
在默认情况下,查询发送到 ES 的一个节点上,这个节点要将查询分散到所有的节点的分片和副本上,假如有 5 个分片和 1 个副本,那么这 5 个分片都会被查询到(分片和对应的副本因为一样,只会有一个被用到),在分片上进行的这次查询,只会返回文档的标识符和得分,返回给之前发送分散查询的那个节点那里。这个节点要等所有分片的结果都汇总以后,收集结果,进行得分的排序(从低到高)。
第二步,发送请求获取所有所需文档返回查询结果。由于通常不需要查询的所有结果,只需要一部分,所以查询只需要发送到持有所需文档的分片上即可,就不需要去所有分片上收集文档了。
搜索类型
不同的搜索类型,可以指定查询在内部的处理方式。
query_then_fetch
默认的搜索类型。上述的两步查询,第一步分发到各个分片,汇总,第二步查询 size 数量的文档,去所在的分片获取文档并返回。
query_and_fetch(目前6.X版本已不支持)
最快最简单的搜索类型。查询在所有分片并行查询,每个分片都返回 size 数量的文档,即总数为分片乘以 size 数量的记录数。
dfs_query_and_fetch(目前6.X版本已不支持)
和 query_and_fetch 类似,只是在查询时加入了分布式词频的计算,从而文档的得分更精确,和查询更相关。
dfs_query_then_fetch
和 query_then_fetch 类似,也是加入了词频的计算。
这些搜索类型,在使用时,加上 search_type 参数即可:
curl -H 'Content-Type: application/json' -XGET 'localhost:9200/book/article/_search?pretty=true&search_type=dfs_query_then_fetch' -d
'{
"query" : {
"term" : { "title" : "ElasticSearch" }
}
}'
搜索偏好
_local : 在可能的情况下,只在发送请求的节点上的可用分片上执行搜索
_prefer_nodes:node_id : 在提供标识符的节点上执行搜索
_shards:2,3 : 在提供标识符的分片上执行操作,如分片 1 和 2 ,和其他首选项共同使用时,_shards标识符在前
_only_node:node_id : 只在提供标识符的节点上执行搜索
curl -H 'Content-Type: application/json' -XGET 'http://localhost:9200/books/article/_search?pretty=true&preference=_local' -d '{"query" : {"term" : { "title" : "ElasticSearch" }}}'
另外,已过时的,ES 7.0 后不支持的:
_primary : 只在主分片上执行搜索,不使用副本。当想使用索引中最近更新的、还没复制到副本中的信息,这个是很有用的
_primary_first : 如果主分片可用,只在主分片上执行搜索,否则才在其他分片上执行
_replica : 只在副本分片上执行搜索
_replica_first :如果副本分片可用则在其上进行搜索,否则,在其他分片执行