之前获取 es 是单条“记录”,例如 GetResponse response = client.prepareGet("twitter", "tweet", "1").get(); 如果获取记录列表则要通过“搜索”。最简单的 es 搜索是:
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.action.search.SearchType;
import org.elasticsearch.index.query.QueryBuilders.*;
SearchResponse response = client.prepareSearch().execute().actionGet();// 获取全部
这样太简单了,没有任何条件的搜索,不足以反映 es 的强大。构建一个复杂的搜索,我们需要 SearchRequestBuilder 的帮忙,由它的对象来执行搜索。
SearchRequestBuilder searchRequestBuilder = client.prepareSearch("index1", "index2");
searchRequestBuilder .setTypes("type1", "type2"); // es 的搜索 Search 不但联合多个库(index1、index2),而是可以是跨类型的(即跨表的 type1、type2)。
//设置查询类型
searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);
//设置分页信息
searchRequestBuilder.setFrom(0).setSize(10);
// 按照时间降序
searchRequestBuilder.addSort("crawlDate", SortOrder.DESC);
// 设置是否按查询匹配度排序
searchRequestBuilder.setExplain(true);
……
searchRequestBuilder.setSearchType,设置搜索类型,主要的搜索类型有:
- QUERY_THEN_FETCH:查询是针对所有的块执行的,但返回的是足够的信息,而不是文档内容(Document)。结果会被排序和分级,基于此,只有相关的块的文档对象会被返回。由于被取到的仅仅是这些,故而返回的 hit 的大小正好等于指定的 size。这对于有许多块的 index 来说是很便利的(返回结果不会有重复的,因为块被分组了)
- QUERY_AND_FETCH:最原始(也可能是最快的)实现就是简单的在所有相关的 shard上执行检索并返回结果。每个 shard 返回一定尺寸的结果。由于每个shard已经返回了一定尺寸的hit,这种类型实际上是返回多个 shard的一定尺寸的结果给调用者。
- DFS_QUERY_THEN_FETCH:与 QUERY_THEN_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
- DFS_QUERY_AND_FETCH:与 QUERY_AND_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
- SCAN:在执行了没有进行任何排序的检索时执行浏览。此时将会自动的开始滚动结果集。
- COUNT:只计算结果的数量,也会执行 facet。
继续定义 searchRequestBuilder,
searchRequestBuilder.setQuery(QueryBuilders.termQuery("multi", "test")) // Query 匹配关键字
searchRequestBuilder.setPostFilter(QueryBuilders.rangeQuery("age").from(12).to(18)) // Filter 表示范围
指定查询条件。es 内置丰富的查询条件,我们后面再详述。
最后执行搜索查询,
//执行查询
SearchResponse response = searchRequestBuilder.execute().actionGet();
SearchHits searchHits = response.getHits();
System.out.println("总数:"+searchHits.getTotalHits());
SearchHit[] hits = searchHits.getHits();
for (SearchHit hit : hits) {
String json = hit.getSourceAsString();
}
如果换作 HTTP API,可以通过 _search Action 传人 q= 参数进行 QueryString 搜索:
GET /megacorp/employee/_search?q=last_name:Smith
// 另外的写法,效果等价
GET /megacorp/employee/_search
{
"query" : {
"match" : {
"last_name" : "Smith"
}
}
}